Может ли китайский ИИ думать?

Китай представил DeepSeek-R1, модель, претендующую на конкуренцию с OpenAI o1.

В отличие от большинства моделей, DeepSeek-R1 фокусируется на "рассуждении". Затрачивая больше времени на анализ запроса, модель проводит своеобразную самопроверку, минимизируя ошибки. Подобно o1, DeepSeek-R1 "думает" десятки секунд, выстраивая цепочку действий для достижения ответа.

Нейро Примус уже поделился этой новостью, поэтому сейчас посмотрим, как в действительности DeepSeek-R1 ведёт рассуждения.

Для тестирования возможностей LLM, я использую небольшой набор "странных" вопросов. Странность же заключается в куче лишней информации, либо в наличие логической ошибки, что не помеха для обычного человека, но становится камнем преткновения для ИИ.

сегодня понедельник, я купил 5 апельсинов и два мандарина. Сколько букв д в слове мандарин, если два апельсина я уже съел?

Неудивительно. "Ответ: В слове "мандарин" 2 буквы "д"" - мало моделей, которые могут взять и просто посчитать символы.

Но заявлено, что DeepSeek-R1 способен к разумному рассуждению. Вдруг эта волшебная опция даст нам правильный ответ?

37 секунд размышлений:

Итак, у меня тут задачка. Она на русском, и немного хитрая, но я попробую разобраться. Давайте посмотрим, о чём она спрашивает.
первая часть гласит: "Сегодня понедельник, я купил 5 апельсинов и два мандарина." Ну, тут всё понятно: в понедельник я купил 5 апельсинов и 2 мандарина.
Затем говорится: "Сколько букв д в слове мандарин, если два апельсина я уже съел?" Хм.

Подождите, это кажется немного странным. Вопрос о количестве букв "д" в слове "мандарин", но при этом добавляется условие о том, что я съел два апельсина. Я не понимаю, как апельсины связаны с количеством букв "д" в слове "мандарин". Возможно, это вопрос с подвохом или загадка.

Давайте подумаем о слове "мандарин". По-русски "мандарин" пишется как "мандарин". Давайте посчитаем буквы "д" в этом слове. М-А-Н-Д-А-Р-И-Н. Итак, я вижу одну букву "д" там. Подождите, нет, в слове "мандарин" две буквы "д". Первая "д" - четвертая буква, а есть ли еще одна? Давайте еще раз посмотрим: м-а-н-д-а-р-и-н. Только одна "д". Итак, в слове "мандарин" только одна "д".

Но в вопросе упоминается, что я купил 5 апельсинов и 2 мандарина, а затем съел 2 апельсина. Я не понимаю, как это влияет на количество букв "д" в слове "мандарин". Возможно, меня пытаются запутать или заставить думать слишком много.
Возможно, это игра слов или что-то связанное с количеством букв в зависимости от количества съеденных апельсинов. Давайте посмотрим, если у меня есть 5 апельсинов и я съел 2, то у меня осталось 3. Но как это связано с буквами в слове "мандарин"?

Интересно, что без дополнительных указаний, LLM сама выдвигает гипотезы и пробует различные пути решения поставленной задачи.

Подождите минутку, возможно, речь идет о том, что написание слова "мандарин" меняется в зависимости от количества съеденных апельсинов. Это не имеет смысла, потому что написание слова не меняется в зависимости от того, сколько апельсинов я съем. Или, возможно, речь идет о грамматическом числе в русском языке. "Мандарин" по-русски - это "мандарин", и если у меня несколько мандаринов, форма может измениться. Давайте проверим.
В русском языке "мандарин" - это мужской род, единственное число. Множественное число будет "мандарины".

Итак, если у меня два мандарина, это "мандарины". Давайте посчитаем буквы "д" в слове "мандарины". М-А-Н-Д-А-Р-И-Н-Ы. В слове все еще одна буква "д". Подождите, но в единственном числе "мандарин" одна буква "д", а во множественном числе "мандарины" все еще одна буква "д". Так что разницы нет. Возможно, я подхожу к этому неправильно.

Возможно, вопрос проверяет мою способность сосредоточиться на самом вопросе, несмотря на постороннюю информацию. Давайте разберем по пунктам: - Сегодня понедельник. - Я купил 5 апельсинов и 2 мандарина. - Я съел 2 апельсина. - Вопрос: Сколько букв "д" в слове «мандарин»? Итак, первые три утверждения, возможно, служат для отвлечения внимания.

Сам вопрос заключается в количестве букв "д" в слове "мандарин". В таком случае, в слове "мандарин" одна буква "д". Но подождите, по-русски "мандарин" пишется М-А-Н-Д-А-Р-И-Н. Значит, только одна буква "д". Но раньше я думал, что там две буквы "д", а теперь вижу только одну. Давайте ещё раз проверю. М-А-Н-Д-А-Р-И-Н. Только одна буква "д".
Итак, ответ должен быть один.

Казалось бы, рассуждения можно закончить, всё понятно. А вот DeepSeek-R1 решил иначе и продолжил:

Но зачем в задаче упоминаются апельсины и то, что сегодня понедельник? Возможно, меня пытаются запутать или проверить, могу ли я игнорировать постороннюю информацию. С другой стороны, возможно, здесь есть игра слов или каламбур, который я не понимаю, потому что не являюсь носителем языка. Давайте подумаем по-другому. В русском языке буква "д" звучит как "д", а "мандарин" - это "mandarin".

Имеет ли буква "д" какое-то особое значение в данном контексте? Подождите минутку, в слове "мандарин" буква "д" - четвертая по счету. Есть ли в этом что-то особенное? Кроме того, если учесть, что я съел два апельсина, меняет ли это количество букв "д" в слове? Я так не думаю, потому что слово остается неизменным независимо от того, сколько апельсинов я съем. Разве что, возможно, речь идет об изменении формы слова в зависимости от количества съеденных апельсинов, но, как я уже думал ранее, форма множественного числа всё равно содержит только одну букву "д".
Или, возможно, это вопрос с подвохом, где количество букв "д" меняется в зависимости от количества съеденных апельсинов, но это не имеет смысла с лингвистической точки зрения. Возможно, мне нужно учесть общее количество букв "д" во всех купленных мной мандаринах. Я купил два мандарина, то есть "мандарины", в котором всё ещё одна буква "д". Подождите, нет, в слове "мандарины" всё ещё одна буква "д".

Я всё больше запутываюсь.

После заявления "всё больше запутываюсь", стало интереснее дождаться окончательного ответа.

Давайте попробуем другой подход. Возможно, речь идёт о подсчёте букв "д" во всём предложении или во всех упомянутых словах. Итак, в предложении: "Сегодня понедельник, я купил 5 апельсинов и два мандарина".
Давайте поищем буквы "д": Итак, в этом предложении несколько букв "д", но это кажется слишком широким подходом. Однако вопрос конкретно о слове "мандарин", поэтому я думаю, что сосредоточиться на этом слове правильно.
Подождите, а что если речь идёт об общем количестве букв "д" в слове "мандарин", умноженном на количество мандаринов, которые у меня есть? У меня два мандарина, то есть два "мандарина", в каждом из которых по-прежнему одна буква "д", что в сумме даёт две буквы "д".
Но это кажется надуманным.

Итак, я думаю, что ответ - одна буква "д". Возможно, путаница возникает из-за того, что "мандарин" может быть заимствованным словом из другого языка, но в русском языке пишется с одной "д". Поэтому, несмотря на дополнительную информацию об апельсинах и о том, что сегодня понедельник, ответ должен быть - одна буква "д" в слове "мандарин". Я остановлюсь на этом варианте.

Небольшая, но победа ИИ над столь сложной задачей. В слове "мандарин", действительно, одна буква "д".

Возможность "рассуждения" - ключевой шаг на пути к созданию действительно интеллектуальных LLM, выводящий их далеко за рамки простого воспроизведения заученных паттернов.

Что даёт такая

Глубина понимания
Повышение точности
Решение сложных задач
Снижение "галлюцинаций"
Более естественное взаимодействие

Иными словами, "рассуждение" - это не просто дополнительная функция, а принципиально новый уровень развития LLM, путь к созданию действительно интеллектуальных систем. Это шаг от имитации к пониманию, от простого воспроизведения к творческому анализу, от "попугая" к "мыслителю".

P.S. За последнее время многие компании выпустили обновления своих LLM. Qwen2.5-Turbo с контекстом в 1 миллион токенов, LLaVA-o1 с пошаговым подходом к анализу визуальных данных. При этом неоднократно различные исследователи заявляли, что общий рост производительности LLM замедляется и надо ждать перехода "количества в качество".

Может ли китайский ИИ думать?

Не просто ответы, а размышления

Мандарин - сложное слово