В Китае представили новую ИИ-модель DeepSeek-R1

Китайский разработчик инструментов искусственного интеллекта DeepSeek представил новую ИИ-модель DeepSeek-R1. Она относится к моделям, наделённым так называемой «возможностью рассуждения» и, по заявлению создателей, может конкурировать с o1 от OpenAI.

В Китае представили новую ИИ-модель DeepSeek-R1
  • Модели с возможностью рассуждения отличаются от обычных аналогов тем, что ищут ответы на запросы более тщательно и выполняют более эффективную проверку найденной информации. Это помогает им снижать количество ошибок и «галлюцинаций», но в то же время они обрабатывают запросы медленнее и тратят больше времени на поиск ответов.
  • DeepSeek-R1 способна «рассуждать» на тему заданного вопроса, составлять план и выполнять ряд других действий, которые помогают прийти к верному ответу. Время обработки запроса зависит от его сложности – от нескольких секунд на легкие вопросы, до нескольких десяток секунд на сложные.
  • Компания утверждает, что DeepSeek-R1 была проверена на двух тестах для оценки эффективности ИИ-моделей – AIME и MATH, и показала результаты, превышающие показатели модели o1-preview от OpenAI.
Изображение: DeepSeek
Изображение: DeepSeek
  • При этом, как и любой новый продукт, модель не лишена изъянов: например, некоторые пользователи в соцсети X сообщили, что DeepSeek-R1 допускает ошибки в решении логических задач – в частности, неправильно играет в крестики-нолики (портал TechCrunch отмечает, что та же проблема отмечается и у o1). Также присутствуют комментарии, что у модели не до конца отрегулированы правила безопасности, и она может выдавать потенциально опасный контент.
  • Сейчас модель доступна на сайте компании в виде preview-версии: она бесплатна, но может обрабатывать до 50 запросов в день. В будущем разработчики планируют открыть исходный код DeepSeek-R1, а также выпустить API.

Источник: TechCrunch

Если вам понравилась статья, поделитесь ею в своем блоге или поставьте нам оценку, чтобы о проекте узнало как можно больше читателей!

33
2 комментария

Как мы отметили в статье, модель пока не доработана и может выдавать ошибки или неверные суждения…