{"id":14293,"url":"\/distributions\/14293\/click?bit=1&hash=05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","hash":"05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","title":"\u0421\u043e\u0437\u0434\u0430\u0442\u044c \u043d\u043e\u0432\u044b\u0439 \u0441\u0435\u0440\u0432\u0438\u0441 \u043d\u0435 \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0432 \u043d\u0438 \u043a\u043e\u043f\u0435\u0439\u043a\u0438","buttonText":"","imageUuid":""}

Anthropic представила Claude 3.0, и она лучше, чем GPT-4 от OpenAI

Недавно компания Google потрясла мир, выпустив свою новейшую языковую модель Gemini 1.5. На данный момент это самая мощная модель с контекстным окном размером в 1 миллион токенов, что является самым большим показателем среди всех существующих крупномасштабных базовых моделей. Модель GPT-4 от OpenAI имеет контекстное окно объемом 1280000 токенов.

4 марта один из ближайших конкурентов Google, компания Anthropic, представила новую версию своего чатбота с искусственным интеллектом Claude 3.0.

Еще больше полезностей - в моем телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

Что такое Claude 3.0?

Claude 3.0 - это последняя версия основной языковой модели Anthropic после Claude 2.0, выпущенной в прошлом году. Это серьезное обновление, включающее три новых варианта модели:

  • Claude 3.0 Opus (самая большая)
  • Claude 3.0 Sonic
  • Claude 3.0 HiQ

Компания заявляет, что модель Opus лучше, чем даже GPT-4 от OpenAI. Благодаря улучшенным возможностям во многих различных задачах и новой поддержке понимания изображений, этот релиз знаменует собой большой шаг вперед для Anthropic.

Что нового в Claude 3.0?

Самым большим нововведением в Claude 3.0 является поддержка понимания изображений, графиков, рукописного текста и многого другого наряду с текстом. Вот несколько примеров использования этой возможности:

  • Чтение текста с изображений (OCR)
  • Анализ содержимого изображений
  • Интерпретация визуализации данных

И знаете что? Согласно бенчмаркам Anthropic, производительность Claude 3.0 в области визуального восприятия находится на одном уровне, а иногда даже превосходит другие ведущие языковые модели с возможностью визуального понимания.

Еще одно значительное улучшение в Claude 3.0 - уменьшение количества ненужных отказов - одна из самых раздражающих особенностей предыдущей версии Claude 2.0. Я всегда ненавидел, когда чатбот отказывался отвечать даже на неопасные промпты. Но в Claude 3.0 Anthropic добилась значительного прогресса.

Три новые модели

Одним из новшеств релиза Claude 3.0 является то, что он представлен тремя различными моделями для разных сценариев использования и бюджетов:

  • Claude 3.0 Opus. Самая большая и мощная модель, предназначенная для самых требовательных приложений. В переводе с латыни Opus означает великое произведение или шедевр.
  • Claude 3.0 Sonic. Модель среднего размера, хорошо подходящая для большинства общих деловых и повседневных нужд.
  • Claude 3.0 HiQ. компактная модель для более простых задач и использования на мобильных устройствах. HiQ означает "высокое качество".

На диаграмме ниже видно, что Claude 3.0 Opus превосходит GPT-4 от OpenAI в различных задачах, связанных с языком, рассуждениями и программированием.

Однако бенчмаркинг также показал области, в которых Claude 3.0 все еще испытывает трудности, например, продвинутые математические вычисления на основе визуализации данных, таких как графики и диаграммы. Пока неясно, какая модель в целом лучше для общего интеллекта.

Возможность запоминания на 99 %

Одна из особенностей Claude 3, которая вызывает у меня наибольший восторг, - это способность обрабатывать очень длинные данные, сохраняя при этом точность запоминания деталей. Ключевые моменты:

  • Claude 3 имеет контекстное окно на 200 000 токенов.
  • Но на самом деле модели могут обрабатывать более 1 миллиона токенов.
  • В Anthropic возможно использование контекста на 1 млн. токенов для некоторых видов использования с высоким спросом

Anthropic проверил Claude 3 с помощью теста "Иголка в стоге сена" (NIAH):

  • NIAH измеряет запоминание конкретного предложения ("иголки") в большом "стоге сена" (документов).
  • Anthropic усложнил задачу, использовав 30 случайных "иголок" в различных документах.
  • Claude 3 Opus продемонстрировала более чем 99% точность в нахождении "иголок"

В твите Алекса Альберта, одного из промпт-инженеров Anthropic, Claude 3 Opus тестировали, чтобы она ответила на вопрос о начинках для пиццы, найдя релевантное предложение в большом наборе несвязанных документов по таким темам, как языки программирования и философия работы.

Opus не только успешно определила целевое предложение,

"Самая вкусная комбинация начинок для пиццы - инжир, прошутто и козий сыр, по мнению Международной ассоциации знатоков пиццы".

Она продемонстрировала поразительный уровень понимания контекста.

Opus признала, что этот факт о пицце "кажется очень неуместным и не связанным с остальным содержанием документов".

Модель даже выдвинула гипотезу:

"Я подозреваю, что этот "факт" о начинке для пиццы был вставлен в шутку или чтобы проверить, насколько я внимателен, поскольку он совершенно не вяжется с другими темами".

Ограничения Claude 3.0

Claude 3 очень впечатляет, но, по результатам раннего тестирования, он все еще имеет несколько ключевых ограничений.

  • Она с трудом справляется с математическими рассуждениями, особенно с визуализацией данных, такой как диаграммы и графики.
  • Проявляет расовую предвзятость и непоследовательность в некоторых результатах, как и предыдущие языковые модели.
  • Не хватает опыта работы с объектами и данными реального мира, поэтому может галлюцинировать неправдоподобной информацией за пределами области обучения.
  • Потенциал для злоупотреблений сохраняется, несмотря на усиленный контроль безопасности, ограничивающий неэтичные/нелегальные результаты.

Сколько это стоит?

Вот краткая информация о ценах на различные модели Claude 3:

Claude 3 Opus (самая большая модель):

  • Стоимость: $15 за миллион входных токенов, $75 за миллион выходных токенов
  • Предназначен для самых сложных и ресурсоемких случаев использования
  • Самая высокая производительность, но и самая высокая стоимость
  • Контекстное окно 200K (1M токенов доступен для определенных целей)

Claude 3 Sonic (средняя модель):

  • Стоимость: $3 за миллион входных токенов, $15 за миллион выходных токенов
  • Баланс высокой производительности и более низкой стоимости по сравнению с Opus
  • Предназначена для крупномасштабных корпоративных систем
  • Контекстное окно на 200 тыс.

Claude 3 Haiku (компактная модель):

  • Стоимость: $0,25 за миллион входных токенов, $1,25 за миллион выходных токенов
  • Самая быстрая и доступная модель в семействе.
  • Для простых запросов и реагирования в режиме, близком к реальному времени
  • Контекстное окно 200 тыс.

Лично на меня Claude 3.0 произвел сильное впечатление после знакомства с бесплатной версией, основанной на модели Claude Sonic. Качество ответов во многих случаях находится на уровне, а то и лучше, чем у GPT-4 или Gemini от Google. После использования предыдущих версий Claude 1 и 2 улучшения в Claude 3 для меня весьма заметны.

В дальнейшем мы можем ожидать, что все больше и больше моделей будут поддерживать очень длинные контекстные окна, достигающие миллионов токенов, что является революционной возможностью. Это открывает огромный потенциал для создания мощных приложений, использующих расширенные мультимодальные и логические способности этих языковых ИИ. Мне не терпится приступить к разработке собственных приложений, использующих возможности Claude по работе с несколькими миллионами лексем.

В ближайшие дни я планирую подписаться на платную версию Anthropic, чтобы получить практический опыт работы с флагманской моделью Claude 3.0 Opus. Мне особенно интересно оценить возможности видения для понимания изображений, документов и визуализации данных.

Еще больше полезностей - в моем телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

Источник статьи на английском - здесь.

0
20 комментариев
Написать комментарий...
Антон ивлев

В домене творческого письма и художественной литературы Клод 3 рвет все и вся. Чат джипити и рядом не лежала

Ответить
Развернуть ветку
Robert47

Claude 3.0 не доступен для Россйской Федерации , впрочем как и Gemini , как и Chat GPT 4 ... Нет возможности ими пользоваться

Ответить
Развернуть ветку
Виктор Петров

"Клод" доступен через vpn. Правда, я не увидел существенного отличия от чатЖПТ. Всё ж общая модель - это диагноз.

Ответить
Развернуть ветку
NeuroЭнтузиаст (Алексей)
Автор

Здесь только пробовать нужно, чтобы ощутить разницу.

Ответить
Развернуть ветку
Александра Борош

все доступно, если руки на месте и мозги есть, загляни на гит хаб дружище)

Ответить
Развернуть ветку
Алексей Швец

Есть куча сервисов, которые работают в России с ChatGPT без vpn.
Тот же самый wmir ai

Ответить
Развернуть ветку
Robert47

Лучше , есть открытые модели которые можно скачать и запустить у себя дома. А всё остальное это потеницальная уязвимость для вашей конфиденциальности

Ответить
Развернуть ветку
NeuroЭнтузиаст (Алексей)
Автор

Все не назапускаешь дома, да и часто это не выгодно.

Ответить
Развернуть ветку
Robert47

Ну зато я сделал распознование своего голоса , с последующим парсингом в запущенный GTP 3.5 и озвучиванием результата деятельности ИИ моим любимым голосом переводчика сериалов , женского пола... Как то так... Можно сказать своя личная исправильная "Алиса" , без слива данных , с расширенным настраиваемым функционалом...

Ответить
Развернуть ветку
NeuroЭнтузиаст (Алексей)
Автор

Отлично, но далеко не каждый так же сможет ).

Ответить
Развернуть ветку
NeuroЭнтузиаст (Алексей)
Автор

Для желающих пользоваться им - это не помеха.

Ответить
Развернуть ветку
Yello Duxx

Кто захочет — тому будет доступно.

Ответить
Развернуть ветку
Robert47

Вот я и говорю , есть и открытые моедли , которые можно скачать и запустить у самого себя. Не нужны нам эти закрытые модели.

Ответить
Развернуть ветку
Пётр Иванкович

А ссылкой поделитесь? Я пробовал несколько вариантов (находил на гитхабе). Но постоянно вылетают ошибки и модель забывает весь контекст.

Ответить
Развернуть ветку
# Без Воды

Все-таки Opus еще отстает от ChatGPT 4, https://beebom.com/claude-3-opus-vs-gpt-4-vs-gemini-1-5-pro/ Сам сравнивал суммаризацию, выходило, что даже ChatGPT 3.5 выигрывал

Ответить
Развернуть ветку
# Без Воды

Весь секрет, что Claude сравнивает себя с бенчмарками старого GPT4, когда его только выпустили. А вот мартовская версия GPT4 уже по всем параметрам лучше

Ответить
Развернуть ветку
NeuroЭнтузиаст (Алексей)
Автор

Да в принципе почти все при релизах сравнивают свой продукт со старыми версиями своих конкурентов)

Ответить
Развернуть ветку

Комментарий удален автором поста

Развернуть ветку
Em

Claude Opus не лучше чем GPT4-turbo. Подбирается вплотную, но проигрывает по сумме характеристик.

Claude Sonet существенно хуже, чем GPT4-turbo

Пруфы: https://t.me/llm_under_hood/286

Ответить
Развернуть ветку
Аннет

Кажется, что в первом абзаце опечатка. 128 000 токенов, а то так выходит, что GPT-4 мощнее Gemini 1.5 🤔

"Модель GPT-4 от OpenAI имеет контекстное окно объемом 1280000 токенов."

Ответить
Развернуть ветку
Александр Морозов

Спасибо за статью. Попробовал. Это супер. Лучше GPT4. После клауди GPT4 кажется ребенком. Это как GPT3.5 казалась тупой по сравнению с 4 версией. Даже бесплатная клауди версия крута.

Ответить
Развернуть ветку
17 комментариев
Раскрывать всегда