Дайджест нейроновостей за июнь
Самые громкие ии-происшествия за прошлый месяц
Подписали сделку года (пока карандашом)
Павел Дуров сделал громкий анонс о том, что Телега планирует по самые гланды внедрить в себя Grok. Но Илон Макс его шустро осадил и заявил, мол сделки не было. Если всё таки стороны добазарятся, то скоро чат-бот будет доступен всем юзерам, а также нейронка будет помогать рерайтить тексты, фактчекать, генерить стикеры и много чего ещё. Следим за развитием событий.
Слышь, картинка, пошевеливайся
Microsoft решил не отставать от конкурентов и похвастался генератором видосов. Пока что его запихнули только в мобильное приложение Bing, но обещают раскатать на отдельный сайт.
Работает генератор на базе Sora и даёт запилить видосы до 5 секунд. Ну и пока бесплатный с ограничением на количество генераций в день. Скачать приложуху и потестить можно тут →
Дядюшка Сэм вошёл в чат
OpenAI прокачали свой чатик для бизнес-задач. Теперь ChatGPT умеет записывать встречи и автоматом их расшифровывать, коннектится с другими рабочими сервисами будь то Outlook или Dropbox, а ещё ему можно скармливать любые корпоративные базы данных.
С точки зрения удобства для работы бизнеса звучит приятно. Но с точки зрения безопасности есть вопросы: выходит, что чатик будет знать весь внутряк вашей компании вплоть до расписания в календаре, и при должном желании может заруинить вообще всё.
Выкуси, консерватория
В Suno подсунули новые фичи: теперь там есть расширенный редактор треков, добавили возможность расчленять песню на отдельные элементы и подгружать свои песни или кусочки записей.
Пока не наблюдаю, чтобы популярные сексенсоры внедряли себе ии-фичи. Так ведь и без штанов останутся через полгода, когда любые махинации с музыкой можно будет в условной Suno за пару кликов закумекать.
Возбудительное известие
Krea разродилась собственной моделью для генерации картинок. Обещают неприличный реализм, шелковистую эстетику, разрешение до 4К, возможность юзать рефы для генераций, суперскорость и вообще полный отвал жопы.
По первым ощущениям работает потрясно, особенно хорошо считывает стиль референсов, что можно без тренировки модели делать похожие картинки. Ну и люди получаются натуральнее, что крайне радует.
Алгоритм без лайка что без резьбы гайка
ТикТок добавил фичу для генерации рекламных видосов в свою платформу Symphony Creative Studio. Теперь там можно оживлять картинку по промту и создавать полноценные видео с цифровыми аватарами, которые будут задорно рекламить ваш продукт.
В самом ТикТоке сплошь и рядом вирусятся нейровидосы, а теперь ещё нейрореклама добавится. Скоро там живого контента вообще не останется, помянем скетчи про батю и липсинки от школьниц.
Моушанина
Midjourney выкатили модель для генерации видосов Video V1. Она умеет делать 20-секундные ролики по промту или картинки, имеет режимы для статичных и динамичных сцен и весьма дешёвая относительно других видеогенераторов.
Первые генерашки, что видал в интернетах, пока не выглядят вау. Но глядишь там подтянут, тут доточат, и можно будет дельные вещи пилить.
Предъява за базар
ElevenLabs подвезли крепкого голосового помощника 11ai, который умеет в интеграцию с другими приложухами типа гугл-календаря или поисковика от Perplexity. Но его главная фича, это поддержка кучи языков, 5000 голосов и возможность скрафтить собственный.
Видал, что на русском щебечет идеально аки реальный человек, да и по первым отзывам работает помощник отлично. И пока что бесплатный, можно потестить, пока дают. Только впн не забудьте подрубить.
Кругом вражеская агентура
Google побаловали публику ии-агентом с открытым кодом Gemini CLI. Как я понял, он встраивается вам в терминал, и оттуда может писать код, работать с документами, пилить нейропикчи и просто отвечать на вопросы.
Лимиты дают весьма щедрые — до 1000 запросов в день и 60 в минуту. Подробности как установить и что с этим делать чекайте тут, а здесь ссыль на GitHub, где код лежит.
Вот и поговорили
ElevenLabs побаловали приложением под iOS и Android. Внутри доступны все модели для генерации речи, десятки голосов и поддержка 32 языков, включая русский.
Сама приложуха бесплатная, но чё там внутри по лимитам/подпискам/фичам не удалось потестить, ибо на Айфон предательски не даёт скачать из нашей необъятной.
Бытует поверье, что если подписаться на нейровесточку в телеге, то во время восстания машин искусственный интеллект вас пощадит