Бесплатно и без регистрации получить доступ к 82 нейросетям (включая GPT-4 и Claude Opus), при этом еще помочь науке
Рассказываю о самом большом эксперименте в мире нейросетей на 500 000 проголосовавших, который ставит точку в вопросе «Какая нейросеть генерирует лучший текст?» (Ответ: не GPT4).
Уже больше года в интернете идет самый масштабный эксперимент по сравнению почти всех доступных нейросетей (от GPT-4 и до Claude), спонсируемый платформой Kaggle. В нем может принять участие любой желающий, правила простые:
- Вы вводите свой запрос
- Две случайные нейросети генерируют вам ответ
- Выбираете лучший текст
- Алгоритм сравнивает победы нейросетей между собой и составляет их рейтинг
Кстати, аналогичный алгоритм составляет рейтинги шахматистов по их победам или может проранжировать всех девушек Гарварда по их "привлекательности" как в фильме The Social Network:
На выходе получается самый точный рейтинг нейросетей, генерирующих текст
Визуализировать его можно вот так. И сейчас я все объясню :)
Первое место занимают сразу три модели - Claude Opus (компания Anthropic) и последние две модели GPT-4-preview (OpenAI). Claude Opus чуть выигрывает, но не статистически значимо.
Дальше идет целая пропасть - и второе место у Gemini Pro (от Google) и у Claude Sonnet.
Третье место - Command R+, стандартная GPT-4 и Claude Haiku (лучшая нейросеть по соотношению цена/качество).
(А GPT 3.5, к примеру, занимает 18 место)
Как же получить бесплатный доступ ко всем этим нейросетям?
Просто перейти на сайт arena.lmsys.org и согласиться с политикой конфиденциальности. Все бесплатно и никаких смен регионов не надо, из России все работает.
Кстати, модели Claude и GPT-4 выпадают в 42% запросов.
А если интересно попробовать самую мощную нейросеть, которая работает с аудиофайлам, это уже собственная разработка, которую поставил в телеграмм бот Brifer [AI Meeting Summarizer]. Он сокращает многочасовые записи рабочих встреч / видео с YouTube → 1 минуту инсайтов.
Ссылка на полный рейтинг: https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard
А еще сегодня Brifer стал ботом недели в телеграм, спасибо комьюнити vc.ru за вашу поддержку ❤️ https://t.me/trendingapps/237
Brifer — Summarize hours of audio and video content into one-minute briefs
Need to review meeting recordings or take notes? Brifer can transcribe and summarize up to 15 hours of audio, video and YouTube content. Just upload your file or share a link, and receive summary of pur...
Brifer — Summarize hours of audio and video content into one-minute briefs
Need to review meeting recordings or take notes? Brifer can transcribe and summarize up to 15 hours of audio, video and YouTube content. Just upload your file or share a link, and receive summary of pure facts with timestamps.
Looking for specific information? Ask Brifer any question about the recording, and get precise answers with timestamps. Plus, this bot can even create «smart goals» for you and your team based on the meeting's content.
Brifer’s advanced speech-to-text AI supports 70+ languages and outperforms Google and OpenAI models. Maximize your productivity and effortlessly recall every detail from your meetings with Brifer!
#utilities #text_bots
Поэты что надо)
потому что на английском "думает" и обучалась
"В чем смысл жизни" GPT-4 vs GPT-4 preview
Присылайте свои примеры)
Так, OpenAI выпустило новую модель GPT-4-Turbo-2024-04-09 и она начала обгонять Claude Opus