Microsoft представила новую мультиформатную нейросеть

Компания Microsoft объявила о выпуске своей новой нейронной сети Kosmos-1, которая объединяет в качестве вводных данных текст, изображения, аудио и видеоконтент. Исследователи назвали систему «большой языковой мультимодальной моделью» и считают, что такие алгоритмы станут основой общего искусственного интеллекта (AGI), способного выполнять задачи на человеческом уровне.

Kosmos-1 обучался на основе открытых данных из интернета, включая англоязычный текстовый ресурс The Pile объемом 800 ГБ и веб-архив Common Crawl. После обучения исследователи оценили способности модели в нескольких тестах, включая понимание и генерацию языка, подбор субтитров к изображениям, классификацию текста без оптического распознавания символов, визуальные ответы на вопросы и другие. В ближайшее время исследователи планируют опубликовать исходный код проекта на GitHub.

0
Комментарии
-3 комментариев
Раскрывать всегда