Tari S

+96

с 2017

2 подписчика

27 подписок

Tari Sв посте

«Яндекс» выложил в открытый доступ нейросеть YaLM 100B для генерации текстов на русском и английском 23.06.2022

Представляешь, какое было бы дублирование ОГРОМНОЙ работы, если бы обе компании учили одно и то же?
Хорошо, что выложили!

Ответить

Tari Sв посте

«Вы синиц показываете? Красивое!». Что сгенерировали пользователи с помощью нейросети ruDALL-E от «Сбера»06.11.2021

Будет позже в журнале. Процесс рецензирования сейчас идет очень долго, иногда растягивается месяцев на 9 в хороших журналах.

Можете нагуглить спокойно все мои статьи, в т.ч. на Neurips.
https://scholar.google.com/citations?user=sdmdZh8AAAAJ&hl=ru
https://openreview.net/forum?id=AiU1SoiaeMX

scholar.google.com

Татьяна Шаврина

openreview.net

How not to Lie with a Benchmark: Rearranging NLP Leaderboards

Ответить

Tari Sв посте

«Вы синиц показываете? Красивое!». Что сгенерировали пользователи с помощью нейросети ruDALL-E от «Сбера»05.11.2021

Для появления инноваций в продуктах есть несколько стратегий, например, метод интерполяции или постоянный мониторинг зрелости технологий RnD.
Я верю, что самая большая ценность в нашем случае:
1) Open source для всех - OpenAI выложили только научную статью, без кода и без модели. Мы консолидировали усилия нескольких ML-команд, команду вычислительного суперкомпьютера Кристофари, ИИ Институт. Сейчас в англоязычном твиттере уже обсуждают, как прикрутить к нашей модели переводчик. Мы и сами это скоро сделаем)
В этом смысле Сбер выполняет очень важную социальную миссию, если хотите.
2) Развитие российского сообщества вокруг новых технологий. В РФ прекрасные разработчики, но по количеству публикаций в области ИИ Россия совсем не на первых местах, входит только в топ-20. Хочется вносить посиольный вклад и провоцировать новые исследования.
You are welcome!

Ответить

Tari Sв посте

«Вы синиц показываете? Красивое!». Что сгенерировали пользователи с помощью нейросети ruDALL-E от «Сбера»05.11.2021

Радуюсь за Ваш кругозор, Стас! Кажется, его еще можно расширить)

Ответить

Tari Sв посте

«Сбер» представил нейросеть, которая создаёт изображения по описанию на русском языке 02.11.2021

https://rudalle.ru/check_image/d7cb32e6484f45efa56b6808a4147714/%D0%9B%D1%83%D0%BD%D0%B0/

Ответить

Tari Sв посте

Сбер выложил русскоязычную модель GPT-3 Large с 760 миллионами параметров в открытый доступ 30.10.2020

Модели обучались 3 эпохи на всей выборке - это порядка 3-4 недель

Ответить

Tari Sв посте

Самая понятливая нейросеть: зачем нам рейтинг лучших NLP-систем и кто учит русскому языку англоязычные модели 10.09.2020

NLP - название отрасли, NLU - конкретной задачи, поэтому выбрали более общее.

Ответить

Tari Sв посте

50% - вероятность при случайном выборе из 2 вариантов.

У нас не так: почти во всех заданиях выбор из многих вариантов, случайное угадывание дает меньше 20%.
Самая простая система с линейными моделями дает 37%
54.6% - результат трех технологических революций. Немного, но что есть

Ответить

Tari Sв посте

Самая понятливая нейросеть: зачем нам рейтинг лучших NLP-систем и кто учит русскому языку англоязычные модели 09.09.2020

Это хорошее задание! Возьмем на заметку в след релизе :)

Для английского такое есть, называется MultiWOZ - A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling

Ответить

Tari Sв посте

Не все модели подходят для генерации, но нужно обеспечить им разные условия. Поэтому алгоритм такой: делаем максимально сложное содержание, а формат ответа простой. В данном случае нужно выбирать из вариантов.
В заданиях ответы взвешены, чтобы случайное угадывание давало минимальный скор

Ответить