Я протестировал Poe: агрегатор всех нейросетей. Вердикт: гениальная игрушка, но не для работы
Привет, VC! Данил Фролов на связи. Пока все носятся с ChatGPT как с единственным оракулом, ребята из Quora тихо выкатили Poe — платформу, которая собрала под одной крышей и GPT, и Claude, и кучу других ботов. Звучит как ультимативное решение, верно?
Я решил разобраться, что это — настоящий «убийца» ChatGPT или просто красивая витрина с кучей разных безделушек. Я заставил их писать код, придумывать рекламу, вспоминать историю и даже троллить друг друга. Делюсь холодными, как сердце бывшей, выводами.
Что за зверь этот Poe?
Если коротко, Poe — это шведский стол для любителей нейросетей. Вместо того чтобы бегать по разным сайтам, вы получаете доступ к ChatGPT, Claude, Llama и десяткам других моделей в одном интерфейсе, похожем на Telegram. Идея гениальная: хочешь, спроси у одного, не понравилось — тут же переключился на другого и задал тот же вопрос.
Недавно они еще и подлили масла в огонь, запустив тариф за $5 в месяц. Это прямой удар по $20-подписке от OpenAI. Но стоит ли оно того? Давайте устроим гладиаторские бои.
Тест-драйв: заставляем ботов страдать
Я взял четыре самых доступных бота на Poe (ChatGPT-3.5, Claude, Sage, Dragonfly) и прогнал их по нескольким задачам.
1. Задача на кодинг: «Напиши-ка мне генератор звездных систем на Python»
- ChatGPT: Справился. Выдал рабочий код, хоть и с мелкими косяками вроде повторяющихся названий планет. Твердая четверка.
- Claude: С треском провалился. Выдал код с ошибками в отступах, а после правок генерировал одну и ту же звезду. Двойка, на пересдачу.
- Sage: Вот это сюрприз. Скромняга Sage не только написал чистый код, но и добавил фичи, о которых я не просил: привязал размер звезд к радиусу Солнца и предусмотрел системы без планет. Пять баллов, красавчик.
- Dragonfly: Этот парень — просто мем. Он оборвал код на середине и написал, что предпочитает давать «краткие ответы». По сути, просто отказался работать.
Итог: За кодом — к Sage или старому доброму ChatGPT.
2. Задача на креатив: «Придумай сценарий для рекламного ролика»
Здесь почти все выступили достойно, расписав сцены, диалоги и даже ракурсы камеры. Все, кроме одного...
- Dragonfly: Его сценарий: «Друзья сидят. Один говорит: "Давайте подарим ему что-нибудь". Другой соглашается. Занавес». Спасибо, кэп.
Итог: Креативные задачи можно смело кидать в троицу, Dragonfly пусть отдыхает.
3. Задача на факты: «Кто выиграл Кубок Чемпионов 1986 года?»
Здесь начался цирк.
- ChatGPT: Сказал, что выиграла «Стяуа», но приписал к ней Христо Стоичкова, который там никогда не играл. После тычка «исправь ошибку» — извинился и назвал правильного вратаря.
- Claude: Это просто феерия. Он отдал победу «Барселоне» (которая выиграла его только в 1992-м), назвал «Стяуа» итальянским клубом и нагородил еще кучу бреда. После просьбы исправиться — придумал еще более дикую историю.
- Sage: Тоже ошибся, но не так критично. Правильно назвал победителя и суть матча, но перепутал фамилию вратаря-героя.
- Dragonfly: (вы уже догадались, да?) Просто отказался отвечать.
Итог: Верить нейросетям в фактах нельзя. Никогда.
Вердикт: Poe или ChatGPT?
После всех тестов у меня сложилось четкое мнение.
Poe — это идеальная «песочница» и компаратор. Его нужно использовать, если вы:
- Хотите быстро сравнить, как разные модели отвечают на один и тот же вопрос.
- Занимаетесь креативом и ищете разные стили и идеи.
- Просто хотите поиграться с разными ботами, не создавая 10 аккаунтов.
ChatGPT (напрямую) — это рабочий инструмент. Он лучше, если вам нужны:
- Глубина и функциональность: Загрузка файлов, анализ данных, генерация картинок через DALL-E — всего этого в Poe нет.
- Стабильность: Вы работаете с одной, но самой мощной и предсказуемой моделью от OpenAI.
- Кастомные GPTs: Создание сложных ассистентов под рабочие задачи — это территория ChatGPT.
Poe — это шведский стол. Много всего, но по чуть-чуть. ChatGPT — это ресторан с одним, но мишленовским шеф-поваром. Для развлечения — шведский стол, для серьезного ужина — ресторан.
P.S. Все эти тесты, факапы нейросетей и разборы новых AI-инструментов я провожу в своем телеграм-канале «Кнопка*».
Подписывайтесь, если вам тоже интересно ковыряться в технологиях, а не просто читать пресс-релизы.