Tari S

+96
с 2017
2 подписчика
27 подписок

Представляешь, какое было бы дублирование ОГРОМНОЙ работы, если бы обе компании учили одно и то же?
Хорошо, что выложили!

1

Будет позже в журнале. Процесс рецензирования сейчас идет очень долго, иногда растягивается месяцев на 9 в хороших журналах.

Можете нагуглить спокойно все мои статьи, в т.ч. на Neurips.
https://scholar.google.com/citations?user=sdmdZh8AAAAJ&hl=ru
https://openreview.net/forum?id=AiU1SoiaeMX

2

Для появления инноваций в продуктах есть несколько стратегий, например, метод интерполяции или постоянный мониторинг зрелости технологий RnD.
Я верю, что самая большая ценность в нашем случае:
1) Open source для всех - OpenAI выложили только научную статью, без кода и без модели. Мы консолидировали усилия нескольких ML-команд, команду вычислительного суперкомпьютера Кристофари, ИИ Институт. Сейчас в англоязычном твиттере уже обсуждают, как прикрутить к нашей модели переводчик. Мы и сами это скоро сделаем)
В этом смысле Сбер выполняет очень важную социальную миссию, если хотите.
2) Развитие российского сообщества вокруг новых технологий. В РФ прекрасные разработчики, но по количеству публикаций в области ИИ Россия совсем не на первых местах, входит только в топ-20. Хочется вносить посиольный вклад и провоцировать новые исследования.
You are welcome!

10

Модели обучались 3 эпохи на всей выборке - это порядка 3-4 недель

3

50% - вероятность при случайном выборе из 2 вариантов.

У нас не так: почти во всех заданиях выбор из многих вариантов, случайное угадывание дает меньше 20%.
Самая простая система с линейными моделями дает 37%
54.6% - результат трех технологических революций. Немного, но что есть

Это хорошее задание! Возьмем на заметку в след релизе :)

Для английского такое есть, называется MultiWOZ - A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling

1

Не все модели подходят для генерации, но нужно обеспечить им разные условия. Поэтому алгоритм такой: делаем максимально сложное содержание, а формат ответа простой. В данном случае нужно выбирать из вариантов. 
В заданиях ответы взвешены, чтобы случайное угадывание давало минимальный скор