Agnes: документ в формате PDF под названием «Масштабирование языковых моделей: методы, анализ и информация от Training Gopher» представляет анализ производительности языковой модели на основе Transformer в широком диапазоне масштабов модели, от моделей с десятками миллионов параметров до 280 миллиардов параметров модели под названием Gopher. Модели оцениваются по 152 различным задачам, в большинстве из которых достигается самая современная производительность. Исследование показало, что выгоды от масштаба самые большие в таких областях, как понимание прочитанного, проверка фактов и выявление токсичности языка, но в логических и математических рассуждениях имеют меньшую пользу. В документе также представлен целостный анализ обучающего набора данных и поведения моделей, охватывающий пересечение масштаба модели с предвзятостью и токсичностью. Окончательно, в исследовании, обсуждается применение языковых моделей к безопасности ИИ и смягчению последующего вреда. Ключевым выводом этого исследования является то, что более крупные языковые модели могут значительно повысить производительность при выполнении широкого круга задач обработки естественного языка, но также существуют опасения по поводу потенциальной предвзятости и токсичности этих моделей.
Столько текста и совсем нет примеров работы
Первое изображение - саммари этой статьи, на русском.
7 ссылок на примеры из блога, на английском.
Ещё изображение - вопрос по статье на сайте gstory.ru в какое время лучше делать пост на vc.ru
И в конце перевод примера самарри статьи с Arxiv.org разными моделями.
сколько стоит ?