{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

trAIshtalk - как я сделал GPT2 твиттер-бота и почему это важно

Во время очередного колла с моим партнером, обсуждая нашу следующую авантюру, мы думали о внедрении ИИ для оптимизации ряда функций. В 2017 году, у нашего фонда был проект, направленный на оценку ICO и монет по определенным критериям и основываясь на этом опыте (довольно субъективном и негативном), я быстро пришел к выводу: это слишком сложно и дорого, давайте оставим ИИ на поздние стадии проекта.

После оживленной дискуссии мы пригласили эксперта по теме в нашу беседу. Он заверил нас, что инструменты обработки естественного языка (Natural Language Processing или NLP) значительно продвинулись, и теперь даже человек, без опыта программирования, легко обучит модель и сможет использовать ее для генерации текста. Его слова бросили мне вызов. Я видел пару Twitter-ботов раньше и решил сделать свой собственный.

Дано

  • Полное отсутствие практического опыта с Ai / ML
  • Базовое понимание структуры кода (я могу использовать терминал для установки какого-нибудь Ghost или запуска/редактирования пары питон скриптов на AWS)

Цель

  • Собрать минимум 60 тысяч твитов и натренировать модель GPT2 составлять новые.
  • Тема — Криптовалюта.
  • Интегрировать все это, чтобы выбранные твиты публиковались автоматически.

Результат

Я был удивлен тем, как легко было найти полноценное пошаговое руководство о том, как сделать все, что мне нужно.

Моим основным источником информации была статья Макса Вольфа. Возникли проблемы с предоставленным им скриптом python download_tweets, но мне помогла установка и обновление чистой версии Twint.

Используя инструкцию Макса, я собрал 70 000 твитов с популярных Twitter аккаунтов и настроил модель GPT2. Для публикации по расписанию, я использовал комбинацию AirTable и Integromat, супер простое и бесплатное решение. #nocode

Результат здесь: @trAIshtalk

Что дальше?

В качестве следующего шага я хочу научить своего бота отвечать на твиты и отобранных людей и комментарии к своим постам, чтобы сделать его реальной частью крипто-сообщества.

Что все это значит?

Честно говоря, живя пару лет в SF, и слыша из каждого утюга — ИИ для этого, ИИ для того, а читая при этом, что 40 процентов европейских стартапов, классифицированных как компании ИИ, фактически не используют искусственный интеллект.

Я скептически относился к реальному прогрессу и применению технологии.

Но в то же время, я видел реальные примеры:

Конкурирует против топ игрока Starcraft и неплохо показывает себя в 5x5 матчах Dota2. Играх с неполной информацией и миллионами переменных.

https://deepmind.com/blog/article/alphastar-mastering-real-time-strategy-game-starcraft-ii

Все это в совокупности дало мне идею, что технология настолько далека от реальной жизни, от бизнеса и доступна только самым продвинутым и богатым компаниям.

НО, мой маленький эксперимент заставил меня переосмыслить свое отношение к ИИ. Если кто-то с таким небольшим техническим знанием может использовать эту технологию, что действительно умные люди смогут сделать? Мы быстро переработали наш список функций MVP, добавив набор инструментов NLP & ML.

PS.

Узнайте больше об ИИ — Two Minute Papers YouTube

0
Комментарии
-3 комментариев
Раскрывать всегда