trAIshtalk - как я сделал GPT2 твиттер-бота и почему это важно

trAIshtalk - как я сделал GPT2 твиттер-бота и почему это важно

Во время очередного колла с моим партнером, обсуждая нашу следующую авантюру, мы думали о внедрении ИИ для оптимизации ряда функций. В 2017 году, у нашего фонда был проект, направленный на оценку ICO и монет по определенным критериям и основываясь на этом опыте (довольно субъективном и негативном), я быстро пришел к выводу: это слишком сложно и дорого, давайте оставим ИИ на поздние стадии проекта.

После оживленной дискуссии мы пригласили эксперта по теме в нашу беседу. Он заверил нас, что инструменты обработки естественного языка (Natural Language Processing или NLP) значительно продвинулись, и теперь даже человек, без опыта программирования, легко обучит модель и сможет использовать ее для генерации текста. Его слова бросили мне вызов. Я видел пару Twitter-ботов раньше и решил сделать свой собственный.

Дано

  • Полное отсутствие практического опыта с Ai / ML
  • Базовое понимание структуры кода (я могу использовать терминал для установки какого-нибудь Ghost или запуска/редактирования пары питон скриптов на AWS)

Цель

  • Собрать минимум 60 тысяч твитов и натренировать модель GPT2 составлять новые.
  • Тема — Криптовалюта.
  • Интегрировать все это, чтобы выбранные твиты публиковались автоматически.

Результат

Я был удивлен тем, как легко было найти полноценное пошаговое руководство о том, как сделать все, что мне нужно.

Моим основным источником информации была статья Макса Вольфа. Возникли проблемы с предоставленным им скриптом python download_tweets, но мне помогла установка и обновление чистой версии Twint.

Используя инструкцию Макса, я собрал 70 000 твитов с популярных Twitter аккаунтов и настроил модель GPT2. Для публикации по расписанию, я использовал комбинацию AirTable и Integromat, супер простое и бесплатное решение. #nocode

Результат здесь: @trAIshtalk

Что дальше?

В качестве следующего шага я хочу научить своего бота отвечать на твиты и отобранных людей и комментарии к своим постам, чтобы сделать его реальной частью крипто-сообщества.

Что все это значит?

Честно говоря, живя пару лет в SF, и слыша из каждого утюга — ИИ для этого, ИИ для того, а читая при этом, что 40 процентов европейских стартапов, классифицированных как компании ИИ, фактически не используют искусственный интеллект.

Я скептически относился к реальному прогрессу и применению технологии.

Но в то же время, я видел реальные примеры:

trAIshtalk - как я сделал GPT2 твиттер-бота и почему это важно

Конкурирует против топ игрока Starcraft и неплохо показывает себя в 5x5 матчах Dota2. Играх с неполной информацией и миллионами переменных.

https://deepmind.com/blog/article/alphastar-mastering-real-time-strategy-game-starcraft-ii

Все это в совокупности дало мне идею, что технология настолько далека от реальной жизни, от бизнеса и доступна только самым продвинутым и богатым компаниям.

НО, мой маленький эксперимент заставил меня переосмыслить свое отношение к ИИ. Если кто-то с таким небольшим техническим знанием может использовать эту технологию, что действительно умные люди смогут сделать? Мы быстро переработали наш список функций MVP, добавив набор инструментов NLP & ML.

PS.

Узнайте больше об ИИ — Two Minute Papers YouTube

55
Начать дискуссию