Machine learning
Маша Цепелева

«Яндекс» выложил в открытый доступ нейросеть YaLM 100B для генерации текстов на русском и английском Статьи редакции

Её можно использовать для ответов в службе поддержки, генерации рекламных текстов, описания товаров и другого.

  • Это самая большая GPT-подобная модель в свободном доступе, она содержит 100 млрд параметров, сообщил «Яндекс». Теперь её могут использовать все разработчики по открытой лицензии Apache 2.0, нейросеть доступна на GitHub.
  • Языковые модели из семейства YaLM определяют по готовому тексту принцип его построения и генерируют похожий. Например, могут придумывать идеи для рекламных кампаний, создавать описания товаров и видео, генерировать стихи, ответы, поздравления и классифицировать их по стилю речи и другим параметрам.
  • Модель обучали на суперкомпьютерах «Яндекса». YaLM 100B обработала около 2 ТБ текстов на английском и русском языках из открытых датасетов и интернета.
  • «Яндекс» использует YaLM более чем в 20 проектах — например, в в быстрых ответах в «Поиске», голосовом помощнике «Алисе», для ответов в службе поддержки, рекламных объявлений и описания сайтов в сниппетах.
0
112 комментариев
Написать комментарий...
Владимир Степанов

Яндекс выложили в открытый доступ что то помимо персональных данных пользователей - шок

Ответить
Развернуть ветку
Алекс Работяга

Как стали их под государство тащить так и начали сливать) В принципе понять их можно. Зато теперь вот можно сказать что они такие красавцы)

Ответить
Развернуть ветку
Dmitry Popov

ну да, ну да. Раньше то Яндекс в open source ничего не выкладывал

Ответить
Развернуть ветку
nickker

Это не так. Яндекс систематически выкладывает в опенсорс свои ключевые технологии. В открытом доступе находится библиотека машинного обучения CatBoost, которая используется в Поиске и других сервисах Яндекса. В 2016 году компания опубликовала исходный код ClickHouse — высокопроизводительной аналитической системы управления базами данных. Всего пару месяцев назад Яндекс опубликовал исходный код распределённой системы управления базами данных YDB для создания масштабируемых отказоустойчивых сервисов, способных выдерживать большую операционную нагрузку.
В своё время всё это подробно обсуждалось на Хабре.

Ответить
Развернуть ветку
Dmitry Popov

Э. Вы серьезно умудрились в формулировке моего комментария, начинающегося со слов "Раньше то", не увидеть сарказма?

Ответить
Развернуть ветку
nickker

Каюсь, обидно стало за наш посконный и домотканный Яндекс, который на 100% пилят отечественные прогеры.
Приношу извинения 🙂

Ответить
Развернуть ветку
Читать все 112 комментариев
null