Дайджест нейроновостей за июнь

Дайджест нейроновостей за июнь

Самые громкие ии-происшествия за прошлый месяц

Подписали сделку года (пока карандашом)

Павел Дуров сделал громкий анонс о том, что Телега планирует по самые гланды внедрить в себя Grok. Но Илон Макс его шустро осадил и заявил, мол сделки не было. Если всё таки стороны добазарятся, то скоро чат-бот будет доступен всем юзерам, а также нейронка будет помогать рерайтить тексты, фактчекать, генерить стикеры и много чего ещё. Следим за развитием событий.

Слышь, картинка, пошевеливайся

Microsoft решил не отставать от конкурентов и похвастался генератором видосов. Пока что его запихнули только в мобильное приложение Bing, но обещают раскатать на отдельный сайт.

Работает генератор на базе Sora и даёт запилить видосы до 5 секунд. Ну и пока бесплатный с ограничением на количество генераций в день. Скачать приложуху и потестить можно тут →

Дядюшка Сэм вошёл в чат

OpenAI прокачали свой чатик для бизнес-задач. Теперь ChatGPT умеет записывать встречи и автоматом их расшифровывать, коннектится с другими рабочими сервисами будь то Outlook или Dropbox, а ещё ему можно скармливать любые корпоративные базы данных.

С точки зрения удобства для работы бизнеса звучит приятно. Но с точки зрения безопасности есть вопросы: выходит, что чатик будет знать весь внутряк вашей компании вплоть до расписания в календаре, и при должном желании может заруинить вообще всё.

Дайджест нейроновостей за июнь

Выкуси, консерватория

В Suno подсунули новые фичи: теперь там есть расширенный редактор треков, добавили возможность расчленять песню на отдельные элементы и подгружать свои песни или кусочки записей.

Пока не наблюдаю, чтобы популярные сексенсоры внедряли себе ии-фичи. Так ведь и без штанов останутся через полгода, когда любые махинации с музыкой можно будет в условной Suno за пару кликов закумекать.

Возбудительное известие

Krea разродилась собственной моделью для генерации картинок. Обещают неприличный реализм, шелковистую эстетику, разрешение до 4К, возможность юзать рефы для генераций, суперскорость и вообще полный отвал жопы.
По первым ощущениям работает потрясно, особенно хорошо считывает стиль референсов, что можно без тренировки модели делать похожие картинки. Ну и люди получаются натуральнее, что крайне радует.

Алгоритм без лайка что без резьбы гайка

ТикТок добавил фичу для генерации рекламных видосов в свою платформу Symphony Creative Studio. Теперь там можно оживлять картинку по промту и создавать полноценные видео с цифровыми аватарами, которые будут задорно рекламить ваш продукт.

В самом ТикТоке сплошь и рядом вирусятся нейровидосы, а теперь ещё нейрореклама добавится. Скоро там живого контента вообще не останется, помянем скетчи про батю и липсинки от школьниц.

Моушанина

Midjourney выкатили модель для генерации видосов Video V1. Она умеет делать 20-секундные ролики по промту или картинки, имеет режимы для статичных и динамичных сцен и весьма дешёвая относительно других видеогенераторов.

Первые генерашки, что видал в интернетах, пока не выглядят вау. Но глядишь там подтянут, тут доточат, и можно будет дельные вещи пилить.

Предъява за базар

ElevenLabs подвезли крепкого голосового помощника 11ai, который умеет в интеграцию с другими приложухами типа гугл-календаря или поисковика от Perplexity. Но его главная фича, это поддержка кучи языков, 5000 голосов и возможность скрафтить собственный.

Видал, что на русском щебечет идеально аки реальный человек, да и по первым отзывам работает помощник отлично. И пока что бесплатный, можно потестить, пока дают. Только впн не забудьте подрубить.

Кругом вражеская агентура

Google побаловали публику ии-агентом с открытым кодом Gemini CLI. Как я понял, он встраивается вам в терминал, и оттуда может писать код, работать с документами, пилить нейропикчи и просто отвечать на вопросы.

Лимиты дают весьма щедрые — до 1000 запросов в день и 60 в минуту. Подробности как установить и что с этим делать чекайте тут, а здесь ссыль на GitHub, где код лежит.

Вот и поговорили

ElevenLabs побаловали приложением под iOS и Android. Внутри доступны все модели для генерации речи, десятки голосов и поддержка 32 языков, включая русский.

Сама приложуха бесплатная, но чё там внутри по лимитам/подпискам/фичам не удалось потестить, ибо на Айфон предательски не даёт скачать из нашей необъятной.

Бытует поверье, что если подписаться на нейровесточку в телеге, то во время восстания машин искусственный интеллект вас пощадит

1
Начать дискуссию