Gemini — самая мощная большая языковая модель (LLM) от Google. С продуктовой точки зрения копирует ChatGPT: в режиме чата вытворяет с текстом что угодно, может анализировать ваши и генерировать изображения. Утверждают, что качество генерации выше, чем у конкурентов, но проверить это сложно.
Всего за год ChatGPT и Midjourney прошли путь от технологического чуда до рутинного инструмента, которым пользуешься как поисковиком. Но только не в России. Грустно наблюдать, как забор в виде иностранных номеров и VPN мешает ИИ проникать в нашу жизнь. В этом свете хочу порекомендовать вам сервис, которые делают мои друзья.
Считается, что первый короткометражный фильм был снят в 1895 году. Черно-белый и без звука. Прошло чуть больше 100 лет, и эксперименты вышли на новый уровень. Как оживить любую картинку? Да что там картинку, как оживить текст? Достаточно открыть Pika Labs.
Нейросетями для генерации изображений уже никого не удивишь. На этом рынке царят Midjourney и Stable Diffusion, которые умеют почти всё, почти. Но есть одно слабое место, которое пока никто не победил, — тексты. Даже очень простые слова на изображениях даются с трудом, а со шрифтами вообще мрак. И тут на сцену выходит обновлённая DALL-E.
Интернетик захлестнула волна переозвученных мемов: идущий к реке и Данила Багров заговорили на английском, а Маск освоил испанский. Выглядит и звучит настолько хорошо, что сложно отличить оригинал от перевода. Давайте разберёмся, что за нейросеть такое вытворяет.
Вчера я делал обзор нейросети для генерации видео от Runway, сегодня поговорим про другие инструменты, которые они предлагают.
Runway — ИИ сервис для создания и обработки видео. Это Clipdrop в мире видео со множеством разных возможностей, в следующем посте сделаю обзор на другие его функции. А пока поговорим про главную — создание коротких видео на основе текстовых запросов или изображений.
Все пишут про новую версию text-to-image модели Stable Diffusion, которая выдаёт результат не хуже Midjourney и при этом лежит в свободном доступе для разработчиков. Давайте разберёмся, как пользоваться SDXL 1.0 обычному человеку, какие есть для этого сервисы и сколько они стоят.