«Сбер» представил нейросеть, которая создаёт изображения по описанию на русском языке Статьи редакции
В основе лежит DALL-E, которую в январе представила OpenAI.
«Сбер» утверждает, что ruDALL-E — первая нейросеть, которая может генерировать картинки по запросу на русском языке.
Нейросеть обучается одновременно на картинках и текстах и может создавать неограниченное число новых изображений по заданному описанию, рассказали vc.ru в «Сбере».
Модель ruDALL-E XL с 1,3 млрд параметров лежит в открытом доступе на GitHub. Есть вторая версия — ruDALL-E 12B с 12 млрд параметров. Обе в ближайшее время будут доступны на платформе ML Space в хабе предобученных моделей и датасетов DataHub от SberCloud.
ruDALL-E состоит из трёх нейросетей, первая принимает текст и генерирует заданное число картинок, вторая выбирает более удачные, третья — увеличивает их в размере без потери качества.
Нейросеть DALL-E для генерации картинок по описаниям на английском языке представила OpenAI в январе 2021 года. Команды SberDevices, Sber AI и SberCloud воспроизвели её код и запустили обучение модели на платформе ML Space на базе суперкомпьютера «Кристофари».
Обучение заняло 23 тысячи GPU-часов на массиве данных из 120 млн пар текст-изображение. По данным «Сбера», обучение ruDALL-E стало самым большим нейросетевым вычислительным проектом в России и СНГ.
«Лучшая картина Васи Ложкина»
https://rudalle.ru/check_image/aa9b96f20c0b434795bd6831c3f88f8d/%D0%9F%D1%80%D0%BE%D1%85%D0%BE%D0%B4%D0%B8%D1%82%D0%B5%20%D0%BF%D0%B0%D0%B4%D0%BB%D1%8B%20%D0%BC%D0%B8%D0%BC%D0%BE,%20%D1%8D%D1%82%D0%B0%20%D0%B1%D0%B0%D0%B1%D0%B0%20%D0%BC%D0%BD%D0%BE%D0%B9%20%D0%BB%D1%8E%D0%B1%D0%B8%D0%BC%D0%B0.%20%D1%81%D1%83%D0%BA%D0%B8,%20%D0%B2%D1%8B%D0%BB%D0%B5%D0%B7%D0%BB%D0%B8%20%D0%B8%D0%B7%20%D0%BC%D0%B3%D0%BB%D1%8B%20%D0%B2%D1%81%D0%B5%D1%85%20%D0%BF%D0%BE%D1%87%D0%B8%D0%BA%D0%B0%D1%8E,%20%D0%BA%D0%BE%D0%B7%D0%BB%D1%8B!/