{"id":14276,"url":"\/distributions\/14276\/click?bit=1&hash=721b78297d313f451e61a17537482715c74771bae8c8ce438ed30c5ac3bb4196","title":"\u0418\u043d\u0432\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0432\u0430\u0440 \u0438\u043b\u0438 \u0443\u0441\u043b\u0443\u0433\u0443 \u0431\u0435\u0437 \u0431\u0438\u0440\u0436\u0438","buttonText":"","imageUuid":""}

trAIshtalk - как я сделал GPT2 твиттер-бота и почему это важно

Во время очередного колла с моим партнером, обсуждая нашу следующую авантюру, мы думали о внедрении ИИ для оптимизации ряда функций. В 2017 году, у нашего фонда был проект, направленный на оценку ICO и монет по определенным критериям и основываясь на этом опыте (довольно субъективном и негативном), я быстро пришел к выводу: это слишком сложно и дорого, давайте оставим ИИ на поздние стадии проекта.

После оживленной дискуссии мы пригласили эксперта по теме в нашу беседу. Он заверил нас, что инструменты обработки естественного языка (Natural Language Processing или NLP) значительно продвинулись, и теперь даже человек, без опыта программирования, легко обучит модель и сможет использовать ее для генерации текста. Его слова бросили мне вызов. Я видел пару Twitter-ботов раньше и решил сделать свой собственный.

Дано

  • Полное отсутствие практического опыта с Ai / ML
  • Базовое понимание структуры кода (я могу использовать терминал для установки какого-нибудь Ghost или запуска/редактирования пары питон скриптов на AWS)

Цель

  • Собрать минимум 60 тысяч твитов и натренировать модель GPT2 составлять новые.
  • Тема — Криптовалюта.
  • Интегрировать все это, чтобы выбранные твиты публиковались автоматически.

Результат

Я был удивлен тем, как легко было найти полноценное пошаговое руководство о том, как сделать все, что мне нужно.

Моим основным источником информации была статья Макса Вольфа. Возникли проблемы с предоставленным им скриптом python download_tweets, но мне помогла установка и обновление чистой версии Twint.

Используя инструкцию Макса, я собрал 70 000 твитов с популярных Twitter аккаунтов и настроил модель GPT2. Для публикации по расписанию, я использовал комбинацию AirTable и Integromat, супер простое и бесплатное решение. #nocode

Результат здесь: @trAIshtalk

Что дальше?

В качестве следующего шага я хочу научить своего бота отвечать на твиты и отобранных людей и комментарии к своим постам, чтобы сделать его реальной частью крипто-сообщества.

Что все это значит?

Честно говоря, живя пару лет в SF, и слыша из каждого утюга — ИИ для этого, ИИ для того, а читая при этом, что 40 процентов европейских стартапов, классифицированных как компании ИИ, фактически не используют искусственный интеллект.

Я скептически относился к реальному прогрессу и применению технологии.

Но в то же время, я видел реальные примеры:

Конкурирует против топ игрока Starcraft и неплохо показывает себя в 5x5 матчах Dota2. Играх с неполной информацией и миллионами переменных.

https://deepmind.com/blog/article/alphastar-mastering-real-time-strategy-game-starcraft-ii

Все это в совокупности дало мне идею, что технология настолько далека от реальной жизни, от бизнеса и доступна только самым продвинутым и богатым компаниям.

НО, мой маленький эксперимент заставил меня переосмыслить свое отношение к ИИ. Если кто-то с таким небольшим техническим знанием может использовать эту технологию, что действительно умные люди смогут сделать? Мы быстро переработали наш список функций MVP, добавив набор инструментов NLP & ML.

PS.

Узнайте больше об ИИ — Two Minute Papers YouTube

0
Комментарии
-3 комментариев
Раскрывать всегда