Какая нейросеть лучше напишет пост? Тестируем
У меня в канале есть постоянная рубрика «День в науке»: каждый день пишу короткую заметку о том, что случилось в эту дату. Сегодня, 24 декабря, такая тема: день рождения космонавта Олега Скрипочки. Попробую подключить к этому нейросети и протестирую, кто справится лучше.
Соревноваться будут :
ChatGPT
Qwen
DeepSeek
GigaChat
YandexGPT
Будем оценивать качество текста и насколько он фактически верен.
Промт максимально простецкий, но обычно нейросеть меня понимает:
Помоги написать пост на тему: «24 декабря — биография космонавта Олега Скрипочки». Укажи, что случилось в его жизни 24 декабря и какие его основные достижения. Коротко, максимум на два абзаца.
Дисклеймер. Знаю, что результат сильно зависит от подробного промта, но представим, что к нейросети обратился обычный человек без знаний в построении промтов.
Погнали.
GigaChat внутри Telegram
Вот такой текст выдал мне Гигачат:
Текст, очевидно, совсем не подходит для соцсетей, и его надо редачить. Но это еще не самое плохое.
Оказалось, что в этом посте нет ни слова правды. Скрипочка 24 декабря только родился, а Гигачат ему уже кандидатскую степень присудил и даже придумал тему диссертации… Уточняющий вопрос не помог.
Короче, 0/10.
QWEN
С китайской нейросетью дела обстоят получше. Перед тем как выдать текст, она проверила факты и выдала даже ссылки на источники, откуда взяла информацию. Но текст снова подлежит редактуре: в соцсети такое не запостишь.
Оценка: 5/10
ChatGPT
Американский ИИ справился стабильно на троечку с плюсом:
DeepSeek
Ещё один китайский нейросетевой герой думал 16 секунд, показал мне цепочку своих рассуждений и выдал такой текст:
К сожалению на пост это тоже мало похоже, но зато чуть больше фактов, чем у QWEN. За это ставим 5/10.
YandexGPT
Даю еще один шанс российским нейросетям. Яндекс выдал мне просто портянку текста:
Круто, конечно, но это тоже не пост. Хотя информации много и она проверенная, за что ставим 3/10.
Результат
Мне не понравился ни один пост от нейросети, но на мой взгляд лучше всех справились ChatGPT и QWEN. С их текстами можно работать как самостоятельно, так и дать уточняющие промты, чтобы сменить стилистику.
Хуже всех справились российские соцсети. Возможно, им нужны более подробные промты и уточнения, но в данном тесте они абсолютно провалились.
Итог: в нейросеть отправляюсь за фактами и источниками, а пост пишу сама.
Делитесь опытом, в каких нейросетях пробовали писать тексты. Особенно интересны те, которые не протестированы в этом материале.