Я протестировал Poe: агрегатор всех нейросетей. Вердикт: гениальная игрушка, но не для работы

Привет, VC! Данил Фролов на связи. Пока все носятся с ChatGPT как с единственным оракулом, ребята из Quora тихо выкатили Poe — платформу, которая собрала под одной крышей и GPT, и Claude, и кучу других ботов. Звучит как ультимативное решение, верно?

Я решил разобраться, что это — настоящий «убийца» ChatGPT или просто красивая витрина с кучей разных безделушек. Я заставил их писать код, придумывать рекламу, вспоминать историю и даже троллить друг друга. Делюсь холодными, как сердце бывшей, выводами.

Я протестировал Poe: агрегатор всех нейросетей. Вердикт: гениальная игрушка, но не для работы

Если коротко, Poe — это шведский стол для любителей нейросетей. Вместо того чтобы бегать по разным сайтам, вы получаете доступ к ChatGPT, Claude, Llama и десяткам других моделей в одном интерфейсе, похожем на Telegram. Идея гениальная: хочешь, спроси у одного, не понравилось — тут же переключился на другого и задал тот же вопрос.

Недавно они еще и подлили масла в огонь, запустив тариф за $5 в месяц. Это прямой удар по $20-подписке от OpenAI. Но стоит ли оно того? Давайте устроим гладиаторские бои.

Я взял четыре самых доступных бота на Poe (ChatGPT-3.5, Claude, Sage, Dragonfly) и прогнал их по нескольким задачам.

ChatGPT: Справился. Выдал рабочий код, хоть и с мелкими косяками вроде повторяющихся названий планет. Твердая четверка.
Claude: С треском провалился. Выдал код с ошибками в отступах, а после правок генерировал одну и ту же звезду. Двойка, на пересдачу.
Sage: Вот это сюрприз. Скромняга Sage не только написал чистый код, но и добавил фичи, о которых я не просил: привязал размер звезд к радиусу Солнца и предусмотрел системы без планет. Пять баллов, красавчик.
Dragonfly: Этот парень — просто мем. Он оборвал код на середине и написал, что предпочитает давать «краткие ответы». По сути, просто отказался работать.

2. Задача на креатив: «Придумай сценарий для рекламного ролика»

Здесь почти все выступили достойно, расписав сцены, диалоги и даже ракурсы камеры. Все, кроме одного...

Dragonfly: Его сценарий: «Друзья сидят. Один говорит: "Давайте подарим ему что-нибудь". Другой соглашается. Занавес». Спасибо, кэп.

Итог: Креативные задачи можно смело кидать в троицу, Dragonfly пусть отдыхает.

Здесь начался цирк.

ChatGPT: Сказал, что выиграла «Стяуа», но приписал к ней Христо Стоичкова, который там никогда не играл. После тычка «исправь ошибку» — извинился и назвал правильного вратаря.
Claude: Это просто феерия. Он отдал победу «Барселоне» (которая выиграла его только в 1992-м), назвал «Стяуа» итальянским клубом и нагородил еще кучу бреда. После просьбы исправиться — придумал еще более дикую историю.
Sage: Тоже ошибся, но не так критично. Правильно назвал победителя и суть матча, но перепутал фамилию вратаря-героя.
Dragonfly: (вы уже догадались, да?) Просто отказался отвечать.

Итог: Верить нейросетям в фактах нельзя. Никогда.

После всех тестов у меня сложилось четкое мнение.

Poe — это идеальная «песочница» и компаратор. Его нужно использовать, если вы:

Хотите быстро сравнить, как разные модели отвечают на один и тот же вопрос.
Занимаетесь креативом и ищете разные стили и идеи.
Просто хотите поиграться с разными ботами, не создавая 10 аккаунтов.

ChatGPT (напрямую) — это рабочий инструмент. Он лучше, если вам нужны:

Глубина и функциональность: Загрузка файлов, анализ данных, генерация картинок через DALL-E — всего этого в Poe нет.
Стабильность: Вы работаете с одной, но самой мощной и предсказуемой моделью от OpenAI.
Кастомные GPTs: Создание сложных ассистентов под рабочие задачи — это территория ChatGPT.

Poe — это шведский стол. Много всего, но по чуть-чуть. ChatGPT — это ресторан с одним, но мишленовским шеф-поваром. Для развлечения — шведский стол, для серьезного ужина — ресторан.

P.S. Все эти тесты, факапы нейросетей и разборы новых AI-инструментов я провожу в своем телеграм-канале «Кнопка*».

Подписывайтесь, если вам тоже интересно ковыряться в технологиях, а не просто читать пресс-релизы.

Я протестировал Poe: агрегатор всех нейросетей. Вердикт: гениальная игрушка, но не для работы

Что за зверь этот Poe?

Тест-драйв: заставляем ботов страдать

1. Задача на кодинг: «Напиши-ка мне генератор звездных систем на Python»

Итог: За кодом — к Sage или старому доброму ChatGPT.

3. Задача на факты: «Кто выиграл Кубок Чемпионов 1986 года?»

Вердикт: Poe или ChatGPT?