Исторически, до 2014 была модель GAN, которая больше занималась распознаванием образов для поисковых задач. Наверное, все пробовали искать в Google по картинке, а еще Google мог вам найти изображения по запросу, например, картинки с котами, если вы спросили про котов. Потом Ян Гудфеллоу придумал, как заставить одну нейросеть, конкурировать с другой, и получились первые результаты, когда модель нарисовала то, чего раньше не было. А в 2017 Google Brain представили технологию, которая смогла воспринимать абзац текста как единое смысловое целое, понимая контекст. Это называется-Трансформатор. Последняя буква в аббревиатуре GPT. Поскольку, первоначальная модель имела определенные ограничения, связанные с набором данных, которым она была обучена, появились другие модели, которые обучали дополнительно. Самые популярные модели сейчас-это GPT-3 (GPT), Dall-E (GPT), Stable Diffusion (LDM).
Комментарий недоступен
Правильно ли я понял, что библиотеки в открытом доступе и тот же Midjourney использует бесплатную библиотеку? Спасибо)
Статья пушка и попалась ровно тогда когда нужно
Лично для меня искусство самоцель и смысл жизни. Если оно станет ненужным, сменю профессию на киллера, принцип тот же что и в фотографировании, оружие тоже есть, в тир хожу))) Можно например зарабатывать тем что убивать программистов и обналичивать их биткоины, так сказать приятное с полезным.
p.s. нет это не шутка, без искусства жизнь не имеет ни ценности ни смысла, а значит убийство больше не табу. Да и программисты все равно почти роботы, это и не убийство по сути