«Яндекс» выложил в открытый доступ нейросеть YaLM 100B для генерации текстов на русском и английском Статьи редакции

Её можно использовать для ответов в службе поддержки, генерации рекламных текстов, описания товаров и другого.

  • Это самая большая GPT-подобная модель в свободном доступе, она содержит 100 млрд параметров, сообщил «Яндекс». Теперь её могут использовать все разработчики по открытой лицензии Apache 2.0, нейросеть доступна на GitHub.
  • Языковые модели из семейства YaLM определяют по готовому тексту принцип его построения и генерируют похожий. Например, могут придумывать идеи для рекламных кампаний, создавать описания товаров и видео, генерировать стихи, ответы, поздравления и классифицировать их по стилю речи и другим параметрам.
  • Модель обучали на суперкомпьютерах «Яндекса». YaLM 100B обработала около 2 ТБ текстов на английском и русском языках из открытых датасетов и интернета.
  • «Яндекс» использует YaLM более чем в 20 проектах — например, в в быстрых ответах в «Поиске», голосовом помощнике «Алисе», для ответов в службе поддержки, рекламных объявлений и описания сайтов в сниппетах.
0
112 комментариев
Написать комментарий...
Дмитрий Щербак

Так а как её установить и начать использовать. Умельцы пришлите, пожалуйста, инструкцию для не айтишников если не сложно.

Ответить
Развернуть ветку
Alex Moren

На гитхабе написано, что тебе понадобится много видеокарт (200 ГБ).

Ответить
Развернуть ветку
Gradient clipping

С напильником, по идее, можно и на относительно слабых машинах запускать, но это будет медленно.

Ответить
Развернуть ветку
Андрей Иванов

Я думаю если появится такой мануал, то это будет топчик. Примерить, попробовать, потом масштабироваться. Ну или что там еще делают с такими нейронками (я не спец в этом). Дистиллируют? Простите.

Ответить
Развернуть ветку
109 комментариев
Раскрывать всегда