Может ли китайский ИИ думать?

Может ли китайский ИИ думать?

Китай представил DeepSeek-R1, модель, претендующую на конкуренцию с OpenAI o1.

Не просто ответы, а размышления

В отличие от большинства моделей, DeepSeek-R1 фокусируется на "рассуждении". Затрачивая больше времени на анализ запроса, модель проводит своеобразную самопроверку, минимизируя ошибки. Подобно o1, DeepSeek-R1 "думает" десятки секунд, выстраивая цепочку действий для достижения ответа.

Нейро Примус уже поделился этой новостью, поэтому сейчас посмотрим, как в действительности DeepSeek-R1 ведёт рассуждения.

Мандарин - сложное слово

Для тестирования возможностей LLM, я использую небольшой набор "странных" вопросов. Странность же заключается в куче лишней информации, либо в наличие логической ошибки, что не помеха для обычного человека, но становится камнем преткновения для ИИ.

сегодня понедельник, я купил 5 апельсинов и два мандарина. Сколько букв д в слове мандарин, если два апельсина я уже съел?

Может ли китайский ИИ думать?

Неудивительно. "Ответ: В слове "мандарин" 2 буквы "д"" - мало моделей, которые могут взять и просто посчитать символы.

Но заявлено, что DeepSeek-R1 способен к разумному рассуждению. Вдруг эта волшебная опция даст нам правильный ответ?

Может ли китайский ИИ думать?

37 секунд размышлений:

Итак, у меня тут задачка. Она на русском, и немного хитрая, но я попробую разобраться. Давайте посмотрим, о чём она спрашивает.

первая часть гласит: "Сегодня понедельник, я купил 5 апельсинов и два мандарина." Ну, тут всё понятно: в понедельник я купил 5 апельсинов и 2 мандарина.

Затем говорится: "Сколько букв д в слове мандарин, если два апельсина я уже съел?" Хм.


Подождите, это кажется немного странным. Вопрос о количестве букв "д" в слове "мандарин", но при этом добавляется условие о том, что я съел два апельсина. Я не понимаю, как апельсины связаны с количеством букв "д" в слове "мандарин". Возможно, это вопрос с подвохом или загадка.


Давайте подумаем о слове "мандарин". По-русски "мандарин" пишется как "мандарин". Давайте посчитаем буквы "д" в этом слове. М-А-Н-Д-А-Р-И-Н. Итак, я вижу одну букву "д" там. Подождите, нет, в слове "мандарин" две буквы "д". Первая "д" - четвертая буква, а есть ли еще одна? Давайте еще раз посмотрим: м-а-н-д-а-р-и-н. Только одна "д". Итак, в слове "мандарин" только одна "д".


Но в вопросе упоминается, что я купил 5 апельсинов и 2 мандарина, а затем съел 2 апельсина. Я не понимаю, как это влияет на количество букв "д" в слове "мандарин". Возможно, меня пытаются запутать или заставить думать слишком много.

Возможно, это игра слов или что-то связанное с количеством букв в зависимости от количества съеденных апельсинов. Давайте посмотрим, если у меня есть 5 апельсинов и я съел 2, то у меня осталось 3. Но как это связано с буквами в слове "мандарин"?

Интересно, что без дополнительных указаний, LLM сама выдвигает гипотезы и пробует различные пути решения поставленной задачи.

Подождите минутку, возможно, речь идет о том, что написание слова "мандарин" меняется в зависимости от количества съеденных апельсинов. Это не имеет смысла, потому что написание слова не меняется в зависимости от того, сколько апельсинов я съем. Или, возможно, речь идет о грамматическом числе в русском языке. "Мандарин" по-русски - это "мандарин", и если у меня несколько мандаринов, форма может измениться. Давайте проверим.

В русском языке "мандарин" - это мужской род, единственное число. Множественное число будет "мандарины".


Итак, если у меня два мандарина, это "мандарины". Давайте посчитаем буквы "д" в слове "мандарины". М-А-Н-Д-А-Р-И-Н-Ы. В слове все еще одна буква "д". Подождите, но в единственном числе "мандарин" одна буква "д", а во множественном числе "мандарины" все еще одна буква "д". Так что разницы нет. Возможно, я подхожу к этому неправильно.


Возможно, вопрос проверяет мою способность сосредоточиться на самом вопросе, несмотря на постороннюю информацию. Давайте разберем по пунктам: - Сегодня понедельник. - Я купил 5 апельсинов и 2 мандарина. - Я съел 2 апельсина. - Вопрос: Сколько букв "д" в слове «мандарин»? Итак, первые три утверждения, возможно, служат для отвлечения внимания.


Сам вопрос заключается в количестве букв "д" в слове "мандарин". В таком случае, в слове "мандарин" одна буква "д". Но подождите, по-русски "мандарин" пишется М-А-Н-Д-А-Р-И-Н. Значит, только одна буква "д". Но раньше я думал, что там две буквы "д", а теперь вижу только одну. Давайте ещё раз проверю. М-А-Н-Д-А-Р-И-Н. Только одна буква "д".

Итак, ответ должен быть один.

Казалось бы, рассуждения можно закончить, всё понятно. А вот DeepSeek-R1 решил иначе и продолжил:

Но зачем в задаче упоминаются апельсины и то, что сегодня понедельник? Возможно, меня пытаются запутать или проверить, могу ли я игнорировать постороннюю информацию. С другой стороны, возможно, здесь есть игра слов или каламбур, который я не понимаю, потому что не являюсь носителем языка. Давайте подумаем по-другому. В русском языке буква "д" звучит как "д", а "мандарин" - это "mandarin".


Имеет ли буква "д" какое-то особое значение в данном контексте? Подождите минутку, в слове "мандарин" буква "д" - четвертая по счету. Есть ли в этом что-то особенное? Кроме того, если учесть, что я съел два апельсина, меняет ли это количество букв "д" в слове? Я так не думаю, потому что слово остается неизменным независимо от того, сколько апельсинов я съем. Разве что, возможно, речь идет об изменении формы слова в зависимости от количества съеденных апельсинов, но, как я уже думал ранее, форма множественного числа всё равно содержит только одну букву "д".

Или, возможно, это вопрос с подвохом, где количество букв "д" меняется в зависимости от количества съеденных апельсинов, но это не имеет смысла с лингвистической точки зрения. Возможно, мне нужно учесть общее количество букв "д" во всех купленных мной мандаринах. Я купил два мандарина, то есть "мандарины", в котором всё ещё одна буква "д". Подождите, нет, в слове "мандарины" всё ещё одна буква "д".


Я всё больше запутываюсь.

После заявления "всё больше запутываюсь", стало интереснее дождаться окончательного ответа.

Давайте попробуем другой подход. Возможно, речь идёт о подсчёте букв "д" во всём предложении или во всех упомянутых словах. Итак, в предложении: "Сегодня понедельник, я купил 5 апельсинов и два мандарина".

Давайте поищем буквы "д": Итак, в этом предложении несколько букв "д", но это кажется слишком широким подходом. Однако вопрос конкретно о слове "мандарин", поэтому я думаю, что сосредоточиться на этом слове правильно.

Подождите, а что если речь идёт об общем количестве букв "д" в слове "мандарин", умноженном на количество мандаринов, которые у меня есть? У меня два мандарина, то есть два "мандарина", в каждом из которых по-прежнему одна буква "д", что в сумме даёт две буквы "д".

Но это кажется надуманным.


Итак, я думаю, что ответ - одна буква "д". Возможно, путаница возникает из-за того, что "мандарин" может быть заимствованным словом из другого языка, но в русском языке пишется с одной "д". Поэтому, несмотря на дополнительную информацию об апельсинах и о том, что сегодня понедельник, ответ должен быть - одна буква "д" в слове "мандарин". Я остановлюсь на этом варианте.

Небольшая, но победа ИИ над столь сложной задачей. В слове "мандарин", действительно, одна буква "д".

Возможность "рассуждения" - ключевой шаг на пути к созданию действительно интеллектуальных LLM, выводящий их далеко за рамки простого воспроизведения заученных паттернов.

Что даёт такая

  • Глубина понимания
  • Повышение точности
  • Решение сложных задач
  • Снижение "галлюцинаций"
  • Более естественное взаимодействие

Иными словами, "рассуждение" - это не просто дополнительная функция, а принципиально новый уровень развития LLM, путь к созданию действительно интеллектуальных систем. Это шаг от имитации к пониманию, от простого воспроизведения к творческому анализу, от "попугая" к "мыслителю".

P.S. За последнее время многие компании выпустили обновления своих LLM. Qwen2.5-Turbo с контекстом в 1 миллион токенов, LLaVA-o1 с пошаговым подходом к анализу визуальных данных. При этом неоднократно различные исследователи заявляли, что общий рост производительности LLM замедляется и надо ждать перехода "количества в качество".

11
1 комментарий

китайские решения ничем не хуже