Статья про языковые модели, кроме ChatGPT. Какие еще модели есть кроме ChatGPT. Обзор и чем отличаются
В этой статье я решила рассказать, какие есть чат-боты помимо ChatGPT, чем они отличаются и для каких целей подходят. Как раз вы поймете, какие есть новые альтернативы ChatGPT (UPD - новая модель ChatGPT4o уже умеет смотреть видео, про нее отдельно внизу расскажу, для бесплатных пользователей ограничены запросы), в том числе бесплатные, какие есть даже получше, которые уже видео полноценно смотрят, чего не умеет пока ChatGPT, когда есть смысл платить, а когда нет. Да и в целом разберетесь в последних новинках чат-ботов, которые как из рога изобилия вылетают каждую неделю и каждая типа "убийца ChatGPT", я постаралась по полочкам все разложить. Ну и заодно удобно-все в одном месте, как в учебнике)
1) Command R+
Хорошая бесплатная нейросеть.
Cohere выпустил опенсорсную LLM Command R+ , в которой 104 миллиарда параметров. Контекстное окно 128 тысяч токенов, как и у GPT-4 Turbo, поддерживает длительный диалог с пользователем. По данным некоторых бенчмарков Command R+ работает наравне с Claude 3 Sonnet и GPT-4.
Command R+ предназначен для разнообразных задач - написание кода, текста или решение примеров по алгебре.
На сайте написано, что это многоязычная версия, и перечислены 10 языков, в числе которых русский не значится.
Однако, как можно видеть из видео, Command R+ без проблем мне сгенерировал доклад на тему “История развития моды”, да еще и подробно разделил на периоды по простому запросу “раскрой каждый период”.
Мне инструмент понравился, никаких впн, регистраций и прочих препятствий - все просто и быстро. Интерфейс понятный, зашел на сайт, написал запрос и тут же получил ответ. И это при том, что использовала демо-версию, контекст чат-бот действительно запоминает.
2) LLaMa 3
Компания Meta AI * показала новое поколение больших языковых моделей с открытым кодом Llama 3 с параметрами 8B и 70B. По сравнению с предыдущими моделями, у новых улучшенная производительность и способность к рассуждению, а так же они лучше себя проявили в кодинге. Анонсировано, что гигантская 400-миллиардная версия все еще находится в процессе дотренировки.
Чем LLaMa 3 лучше других языковых моделей?
- Знания
По сравнению с конкурентами, бесплатная, превосходит конкурентов по метрикам, кроме Claude Opus от Anthropic - ей она уступает по некоторым показателям.
По количеству “знаний”, которые нейросеть получила при предварительном обучении Llama 3, (причем обе модели - и 8B и 70B) обогнала Gemini Pro 1.5 и Claude 3 Sonnet:
- LLaMa 3 знает 30 языков.
- Интеграция в приложение
Чат-бот в скором времени интегрируют в поисковую строку продуктов Meta* (Instagram, Facebook, WhatsApp и Messenger), а исходный код уже вышел.
- Доступ к актуальной информации
LLaMa 3 имеет доступ к Google и Bing, т.е. к актуальной информации и может в реальном времени отвечать на вопросы.
- Imagine Flash.
Благодаря модели Imagine Flash способна генерировать изображения в реальном времени, пока вы печатаете промпт, а генерация видоизменяется с каждым напечатанным символом - пока только для США (вы знаете, что делать).
Чат-бот в скором времени интегрируют в поисковую строку продуктов Meta* (Instagram, Facebook, WhatsApp и Messenger), а исходный код уже вышел.
LLaMa 3 имеет доступ к Google и Bing, т.е. к актуальной информации и может в реальном времени отвечать на вопросы.
- Llama 3 70b уже появилась на LMSYS
В общем лидерборде Llama 3 заняла 5 место, почти догнав Claude 3 Sonnet и обогнав предыдущую лучшую open-source модель Command R+
В топе по ответам на английском языке Llama 3 уступила только GPT 4 Turbo, обогнав Claude 3, Mistral и недавно вышедшую Mixtral8x22b
Что еще крутого в Llama 3?
Llama 3 генерирует до 600 слов в минуту, то есть в 25 раз быстрее, чем вы печатаете. Можно сгенерировать письма, сказки, договора, отчеты со скоростью несколько страниц в секунду.
Где и как скачать бесплатно
Официальный сайт Meta* (включаем VPN США)
Ссылка на Replicate без VPN, но только генератор текста)
Ссылка на huggingface
Скачать тут
Можно запустить в Groq с любым VPN в один клик — тут
*Компания Meta является экстремистской на территории РФ
3) Reka
4) Claude 3
Про Claude 3, а заодно еще к нему учебник по промптингу и сами промпты
5) Google Gemini 1.5 Pro
Кстати, нейросеть от Google Gemini 1.5 Pro обновили и научили обрабатывать аудио:
Теперь легко можно загрузить длинный подкаст и получить саммари - краткую выжимку на нужном языке, переконвертировать видео-курс в текст или загрузить лекцию, как на видео, и Gemini 1.5 Pro сделает тест по содержанию.
Кстати, вам может быть интересно прочитать мой обзор на новую модель ChatGPT 4o, и для чего ее можно применять.
А так же про обновления ChatGPT 4o, и зачем действительно нужна платная подписка для ChatGPT-4
Надеюсь, статья была для вас полезной, если вы хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни, то добро пожаловать в мой телеграм канал НейроProfit, где я рассказываю, как можно использовать нейросети для бизнеса.