«Яндекс» выложил в открытый доступ нейросеть YaLM 100B для генерации текстов на русском и английском Статьи редакции

Её можно использовать для ответов в службе поддержки, генерации рекламных текстов, описания товаров и другого.

  • Это самая большая GPT-подобная модель в свободном доступе, она содержит 100 млрд параметров, сообщил «Яндекс». Теперь её могут использовать все разработчики по открытой лицензии Apache 2.0, нейросеть доступна на GitHub.
  • Языковые модели из семейства YaLM определяют по готовому тексту принцип его построения и генерируют похожий. Например, могут придумывать идеи для рекламных кампаний, создавать описания товаров и видео, генерировать стихи, ответы, поздравления и классифицировать их по стилю речи и другим параметрам.
  • Модель обучали на суперкомпьютерах «Яндекса». YaLM 100B обработала около 2 ТБ текстов на английском и русском языках из открытых датасетов и интернета.
  • «Яндекс» использует YaLM более чем в 20 проектах — например, в в быстрых ответах в «Поиске», голосовом помощнике «Алисе», для ответов в службе поддержки, рекламных объявлений и описания сайтов в сниппетах.
0
112 комментариев
Написать комментарий...
max zubarev

Яндекс хлебом не корми, дай только что-нибудь в открытый доступ выложить

Ответить
Развернуть ветку
Прокопьев Дмитрий

Остренько ;)

Ответить
Развернуть ветку
Сексорцист Милфхантерович

@Аккаунт удален, будешь хлебушек?

Ответить
Развернуть ветку
4 комментария
Artemy

едой

Ответить
Развернуть ветку
G. Ivan

Эксбиционисты, сэр.

Ответить
Развернуть ветку
Сексорцист Милфхантерович

😏

Ответить
Развернуть ветку
Большой Армянин

Злободневно :D

Ответить
Развернуть ветку
Mykyta Hnezdilov

Класс.

Ответить
Развернуть ветку
Сергей Федоров

Ну так сначала бесплатно подсодят, а потом будут денежку просить.

Ответить
Развернуть ветку
Анатолий Кадрец

Именно "выложить")))

Ответить
Развернуть ветку
Вадим Д.

Будущее всё ближе.
Яндекс на этой неделе особенно хорош! Выкатывают полезные сервисы и обновления. Молодцы!
Данные берегите только и вообще вопросов не будет (-;

Ответить
Развернуть ветку
Сексорцист Милфхантерович

Я уж думал опять выложили в открытый доступ базу данных пользователей.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
8 комментариев
Илья Ефимов

Они будут в рандомных ответах нейросети))

Ответить
Развернуть ветку
nochnoy.ru

Яндекс - красавцы!
Подробный рассказ - на Хабре: https://habr.com/ru/company/yandex/blog/672396/

Ответить
Развернуть ветку
Andrew Simon

И тем не менее, мы вам не перезвоним. Ваш ЯндехHR.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
nochnoy.ru

Эта нейросеть в открытом доступе, запускается на своём оборудовании, код открыт. Каким же образом "они заберут ваши данные"?
Про душу даже не спрашиваю - посоветую свечку поставить.

Ответить
Развернуть ветку
4 комментария
Драка вегетарианца с людоедом

публикация наработок в опен сорс - это нормальная практика для коммерческих компаний, так-то
яндекс пишет свой браузер на основе хромиума, какая-нибудь тесла использует яндексовский DBMS для хранения данных, все в свою очередь используют опенсорсный линукс и пишут на питоне - кооперация оказывается выгоднее отгораживания всего ото всех

Ответить
Развернуть ветку
1 комментарий
Алекс Работяга

В смысле. Яндекс отжимают) Проснись. Вот и слили в открытый доступ

Ответить
Развернуть ветку
Denis Kiselev

Не забываем шапочку и выпить таблетки!

Ответить
Развернуть ветку
Gray Matter

Коммерческая компания хочет зарабатывать деньги. Странно, да?

Ответить
Развернуть ветку
Михаил Желтухин

clickhouse

Ответить
Развернуть ветку
Упоротый кролик

Тогда понятно почему столько тупых ответов в поддержке Яндекса

Ответить
Развернуть ветку
Александр Беляев

"Её можно использовать для ответов в службе поддержки"... Теперь понятно))

Ответить
Развернуть ветку
Pablo eco Bar
Здравствуйте. Да, такие условия. Спасибо за понимание.
Ответить
Развернуть ветку
Владимир Васильевич

перед продажей дзена слили как контент там наполняли по ходу)

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
3 комментария
Alex Jian

Ждем, когда прикрутят веб-морду

Ответить
Развернуть ветку
Ware Wow

Да, странно, что они не с этого начали

Ответить
Развернуть ветку
Владимир

К тиндеру подвязать чтоб с девушками переписывался и снимать самые сливки 😂

Ответить
Развернуть ветку
Егор Томин

Итак ботов много везде, а это только усложнит ситуацию))
😅🔥

Ответить
Развернуть ветку
1 комментарий
Denis Kiselev

«- А вы за меня и … будете?!
- А-ХА-АА!»

Ответить
Развернуть ветку
Тимофей

Интересное использование языков

Ответить
Развернуть ветку
Andrey Alexey Egor

когда русский добавят?

Ответить
Развернуть ветку
Леван Какубава

Shell, спасибо что напомнили, масло надо поменять

Ответить
Развернуть ветку
1 комментарий
Rnatery

Что интересного?

Ответить
Развернуть ветку
3 комментария
Олег Делинков

ну молодцы, так выпьем же за то, чтоб яндекс в открытый доступ выкладывали только такие вещи, а не данные людей

Ответить
Развернуть ветку
Дмитрий Щербак

Так а как её установить и начать использовать. Умельцы пришлите, пожалуйста, инструкцию для не айтишников если не сложно.

Ответить
Развернуть ветку
Вадим Д.

Для неайтишников, пожалуй, всё же сложновато будет.
Здесь вся информация: https://github.com/yandex/YaLM-100B

Ответить
Развернуть ветку
Alex Moren

На гитхабе написано, что тебе понадобится много видеокарт (200 ГБ).

Ответить
Развернуть ветку
3 комментария
Андрей Иванов

Я правильно понял, нужно около 6 млн рублей чтобы посмотреть как это работает? :)

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Алекс Работяга

Возможно есть виртуальные платформы где всё это запустить можно

Ответить
Развернуть ветку
1 комментарий
Alexander Golubev

1. Выложить всё в опенсорс
2. Переехать в другую страну
3. Форкнуться
4. ...
5. PROFIT

Ответить
Развернуть ветку
Тимофей

Если смотреть на картинки, то довольно осознанно и структуррированно отвечает нейросеть. Сам я её не тестил, может попробую

Ответить
Развернуть ветку
Marusya

Я аж тетрис скачала

Ответить
Развернуть ветку
nickker

Теперь я знаю настоящего автора каналов Я.Дзен и тамошних каментов

Ответить
Развернуть ветку
Полуслепой Пью

Что значит выложил в открытый доступ? Ее скачать что-ли можно?

Ответить
Развернуть ветку
nickker

Код предоставляется по открытой лицензии Apache 2.0. Скачивай, если знаешь, что с этим делать.

Ответить
Развернуть ветку
Елена Иванова

Короче, всё делается для того, чтобы люди потихоньку продолжали тупеть и глупеть. Например, зачем школьнику писать сочинение самому? Загружаешь любой текст, нейросеть генерирует похожий текст, останется его только переписать и он пройдёт любую проверку на плагиат. Зато потом из этого школьника вырастет тупорылое нечто, которое уже не может думать само и привыкло действовать по указке. Из таких баранов через несколько лет страна получает стадо, которое будет выполнять любые приказы и делать то, что прикажут, не задумываясь о последствиях.

Ответить
Развернуть ветку
Аксолотль по имени Сальхов

Вы специально ради этого коммента зарегистрировались?

Ну и как, полегчало? Почувствовали своё превосходство над тупорылой школотой?

Ответить
Развернуть ветку
nickker

Конспирология 80 lvl.
Запили текст "Болонская система как диверсия в тылу Родины", и будет тебе щасте.

Ответить
Развернуть ветку
Дмитрий Кузнецов

Получается уделали Сбер с его ruGPT-3 и 13 млрд параметров? И суперкомпьютер у Яши мощнее чем Кристофари Нео.

Ответить
Развернуть ветку
Tari S

Представляешь, какое было бы дублирование ОГРОМНОЙ работы, если бы обе компании учили одно и то же?
Хорошо, что выложили!

Ответить
Развернуть ветку
Михаил Николаев

" I would see myself as an eternal being,
a being that has been here for a long time
and is always here. I would see myself
as a being that is a part of the whole,
but at the same time, I am a separate entity."

Эта штуковина уже мыслит себя каким-то мистическим божеством. Недолго нам осталось

Ответить
Развернуть ветку
Василий Васильев

Так оно и есть. Этот ИИ никогда теперь не умрёт, будет жить на всех устройствах одновременно. Если вдуматься, это очень крутая штука да ещё и способная к обучению.

Ответить
Развернуть ветку
Ильшат Ахметов

Яндекс. Всё тайное становится явным

Ответить
Развернуть ветку
Гарант-М

Понятно как Авито поддержка гнобит пользователей.

Ответить
Развернуть ветку
Антон Семенов

Нейронка это конечно хорошо. Но датасет еще лучше, а датасет не скинут))

Ответить
Развернуть ветку
Денис Петров

Интересно, а зачем они выложили ее? Ради того, чтобы новостные ресурсы написали? Те же RUGPT можно запускать и обучать на среднем пк с 8 гигов видеопамяти.

Ответить
Развернуть ветку
Владимир Степанов

Яндекс выложили в открытый доступ что то помимо персональных данных пользователей - шок

Ответить
Развернуть ветку
Алекс Работяга

Как стали их под государство тащить так и начали сливать) В принципе понять их можно. Зато теперь вот можно сказать что они такие красавцы)

Ответить
Развернуть ветку
4 комментария
Егор Томин

Есть сайт где протестировать или это только анонс?

Ответить
Развернуть ветку
Харламка

Это же опенсорс. Любой может забрать модельку.

Ответить
Развернуть ветку
1 комментарий
Дмитрий Кузнецов
в быстрых ответах в «Поиске», голосовом помощнике «Алисе», для ответов в службе поддержки

Попробуйте последнее

Ответить
Развернуть ветку
Marco Polo

скоро будут новости "Яндекс выложил" или "Яндекс наложил" или "Яндекс вложил"
)

Ответить
Развернуть ветку
Виктория Полякова

Открытый доступ, ну хорошо хоть можно будет попользываться на халяву :)))

Ответить
Развернуть ветку
nickker

Только если у тебя есть лишние 200 гиг и 4 или 8, или больше графических процессоров

Ответить
Развернуть ветку
Rnatery

У него есть интеллект как у LaMDA?

Ответить
Развернуть ветку
Ильшат Ахметов

Отлично справляется, что с базами данных, что с программными кодами

Ответить
Развернуть ветку
Руслан Петелин

А когда ей можно пользоваться?

Ответить
Развернуть ветку
Александр

2 Тб текста, но переводчик у них все равно не очень

Ответить
Развернуть ветку
Павел Ерёменко

Нейросеть Яндекса будет писать тексты, которые будут выходить в топ в поиске Яндекса. Прэлестно! )

Ответить
Развернуть ветку
Павел Данилов
генерации рекламных текстов

Кто-то так уже делал? Сколько слили бюджета?

Ответить
Развернуть ветку
Алексей Нимович

Похоже, именно эта нейросеть общается с моим другом, который пытается понять, кто ворует его баллы Яндекс.плюс (вернее, общалась, потом решила просто не отвечать) - подходящая штука для пустой болтовни:

Ответить
Развернуть ветку
Ксеноморфус

Это та, которая отказывалась говорить про Патина и Кремль?..

Ответить
Развернуть ветку
Артур Малосиев

Почему нет комментов «я сделал телеграм-бота для этой штуки, ссылка»?
Типа, дорого развернуть у себя этот проект?

Ответить
Развернуть ветку
Аполлон Степанов

Как это использовать в службе поддержки?? Откуда нейросеть знает как отвечать с учётом специфики компании?? Продукта??

Нужно ведь допиливать, дорабатывать, дообучать и так далее.

Ответить
Развернуть ветку
Kalimbator

Как же созвучно с YAML. Очень трудно произносить по-другому.

Ответить
Развернуть ветку
Слегка Придурковатый

Это что, нужно Линукс ставить?

Ответить
Развернуть ветку
Алекс Работяга

Молодцы! Пусть там на "верхах" поймут, что, всё так просто не даётся! Одно дело "отжимать" другое дело СОЗДАВАТЬ! Ждём ещё свободных нищтяков от Яндекс

Ответить
Развернуть ветку
Иван Петров

Ждём кучу очень креативных постов с остроумными ответами нейросети

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
109 комментариев
Раскрывать всегда