Как тестировал свежую Алису и что из этого получилось

Вчера на VC.ru увидел статью с бодрым анонсом: «Алиса Про» теперь помогает в Яндекс.Почте генерировать изображения и работать с таблицами. Ещё не успел дочитать, как тут же получил от Яндекса письмо с рекламой новых функций. Совпадение, достойное эксперимента.

Нейросеть, картинки, разные стили… Прямо пугает, как всё просто — а на деле, интрига только начинается
Нейросеть, картинки, разные стили… Прямо пугает, как всё просто — а на деле, интрига только начинается

Сначала все по плану, потом - креативный сбой

Для чистоты эксперимента начал с простого: попросил Алису нарисовать эскиз о поездке в электричке в формате 16:9, вид изнутри вагона. Казалось бы, задача элементарная — и здесь ассистент справился. Получил визуал типичной электрички, всё ровно, по запросу, даже формат выдержан.

Когда всё просто: задал тему, получил электричку. Ассистент справляется, если не просить ничего необычного. Магия Яндекса в действии — пока не просишь креатива!
Когда всё просто: задал тему, получил электричку. Ассистент справляется, если не просить ничего необычного. Магия Яндекса в действии — пока не просишь креатива!

Потом решил усложнить задачу: попросил Алису изменить стиль изображения —киберпанк всё той же электрички. И вот тут начались чудеса интерфейса: визуал остался электричкой, но формат вдруг стал квадратным. Казалось бы, параметры размера не трогал, про 16:9 напомнил, но Алиса решила, что «стиль» подразумевает автоматическую смену пропорций.

Получил объяснение ассистента: «Вероятно, при генерации изображения произошёл сбой параметров — соотношение сторон». То есть стоит поменять стиль — и адекватное выполнение задания превращается в лотерею: просишь одно, получаешь другое.

Формат меняется внезапно, причины объясняются загадочно: «Сбой параметров» — и вот уже квадрат вместо привычной прямоугольной электрички. Эстетика случайности. Инновации от Алисы: не угадаешь, какую геометрию выберет нейросеть в следующий раз.
Формат меняется внезапно, причины объясняются загадочно: «Сбой параметров» — и вот уже квадрат вместо привычной прямоугольной электрички. Эстетика случайности. Инновации от Алисы: не угадаешь, какую геометрию выберет нейросеть в следующий раз.

Интересно выходит: задаёшь тему «электричка», получаешь её, но формат и пропорции изображения каждый раз Алиса определяет сама, независимо от пожеланий пользователя.

Сценарий классический: обещают гибкость и «разные стили», а по факту приходится угадывать, в каком виде ты увидишь свой визуал.

Визуал от Алисы: нейросеть Яндекса идёт своим путём

Ну, сбой так сбой — привычное дело для теста нового ассистента.А у меня как раз задача по работе: готовлю материал про детекторы ИИ в копирайтинге и нужно быстро придумать визуал к статье. Думаю — вот удачный случай проверить Алису на практике.

Обычно действую по стандарту: открываю Comet, ставлю ассистенту задачу — «сгенерируй визуал для статьи», через пару секунд получаю идеально подходящую картинку. Минимум действий, максимум смысла.

Вот как выглядит идеальный визуал: копирайтер под прицелом нейросетей и менеджера-детектива. Это именно то, что ждёшь от иллюстрации для статьи про AI-детекторы — и смысл, и атмосфера, и, наконец, сразу по теме. Даже если задача поставлена с ошибками. 
Вот как выглядит идеальный визуал: копирайтер под прицелом нейросетей и менеджера-детектива. Это именно то, что ждёшь от иллюстрации для статьи про AI-детекторы — и смысл, и атмосфера, и, наконец, сразу по теме. Даже если задача поставлена с ошибками. 

Ради чистоты эксперимента решаю попробовать тоже самое с новым Яндекс-ассистентом. Задача для ассистента ясна: кратко сформулировал тему, отправил запрос — жду результат.

Но вместо мгновенного вдохновения, как это обычно бывает с Comet, Яндекс.Алиса начинает рассуждать и предлагать концепции. Тут тебе «Противостояние», тут «символический подход» — получаешь длинный список вариантов, будто у нейросети творческий вечер с брейнштормом. Визуала нет, зато размышлений — на полстатьи!

Когда ждёшь визуал, а получаешь мастер-класс по мозговому штурму от Алисы. Реальные картинки? Нет, но идеи — сколько угодно!
Когда ждёшь визуал, а получаешь мастер-класс по мозговому штурму от Алисы. Реальные картинки? Нет, но идеи — сколько угодно!

Первая генерация: город будущего от Яндекс.Алисы

Ожидаешь, что нейросеть поймёт задачу и выдаст что-то про детекторы ИИ в копирайтинге. На выходе — мрачный неоновый мегаполис, где сияющие экраны буквально заполонили всё пространство. Детекторы ИИ? Видимо, их ищут где-то среди этих башен и подсветки.

Можно долго гадать: то ли Алиса решила, что копирайтеры живут в хайтек-технополисах и работают под надзором розовых экранов, то ли просто увидела в «детекторах» что-то связанное с технологиями наблюдения. В любом случае, к теме статьи эта эстетика светящихся небоскрёбов имеет примерно такое же отношение, как бигборды к настоящей нейронке. Зато атмосфера — на уровне Голливуда!

Генерация по версии Алисы: ищем детекторы ИИ где-то в лабиринте неоновых небоскрёбов. Кто сказал, что будет понятно?
Генерация по версии Алисы: ищем детекторы ИИ где-то в лабиринте неоновых небоскрёбов. Кто сказал, что будет понятно?

Вторая генерация: ближе к делу… но всё равно не туда

Недолго думая, Алиса снова предлагает неон и хай-тек, только теперь действие происходит на рабочем столе цифрового копирайтера: ноутбук, смартфон, какие-то виртуальные гаджеты и интерфейсы в духе «смешаем всё, что связано с технологиями». Цвета яркие, абстракция зашкаливает.

В этот раз уже есть намёк на работу с текстом: в центре экрана — якобы документ, вокруг которого парят какие-то значки и графины, но детекторы ИИ остались за кадром. Такое впечатление, что нейросеть услышала про современные редакторы, решила добавить все возможные значки и эффекты, чтобы уж точно не промахнуться по теме технологии и копирайтинга.

При ближайшем рассмотрении становится ясно: даже если Алиса где-то и попыталась намекнуть на копирайтерский труд, содержательный текст на экране так и не появился. Вместо русских слов — классические кракозябры, набор случайных букв и символов, за которые, кажется, ответственен всё тот же мистический «русский ИИ».

Традиция стабильная: сколько бы ни просил иллюстраций с кириллицей — российские нейросети по-прежнему генерируют латинский суррогат, абстрактные последовательности и дизайнерские загогулины. Видимо, идея «пойми копирайтера» для Яндекс.Алисы всё ещё на стадии бета-тестирования.

В общем, шаг ближе — но всё равно рядом с темой, а не в ней. Иллюстрация скорее для IT-выставки или мобильного приложения, чем для статьи про современные AI-детекторы в текстах.

Всё ближе к смыслу, всё дальше от русского языка. Алиса творит будущее текста… кракозябрами и неоновыми пиктограммами.
Всё ближе к смыслу, всё дальше от русского языка. Алиса творит будущее текста… кракозябрами и неоновыми пиктограммами.

Третья попытка: технологичный космос и ещё одна попытка обойти тему

В этот раз Алиса пошла ва-банк и решила, что «детекторы» — это почти ЦЕРН, только для нейросетей. На картинке — абстрактные кубы, графики, датчики и устройства, которыми увешаны все гаджеты вокруг некоего хитроумного блока. Похоже на визуализацию инфраструктуры супер-компьютера, а не хотя бы малейший намёк на тему копирайтинга, текстов или проверки контента.

Русского языка снова нет — на экранах "детекторных" девайсов привычные латинские зюки-закорюки, а сама сцена вполне могла бы украшать сайт cloud-сервиса или продуктовый форум. Интересно, что по задумке ассистента, копирайтер — это почти дата-сайентист, который анализирует мир через интерфейсы, кубики и без единого слова на русском.

Вместо иллюстрации к статье — технологический сон о будущем без копирайтинга, но с абсолютной визуальной стерильностью.
Вместо иллюстрации к статье — технологический сон о будущем без копирайтинга, но с абсолютной визуальной стерильностью.

Четвертая генерация: Алиса ушла в ретро и вспомнила запрос об электричке

Видимо, после всей этой AI-неоново-кракозябренной кутерьмы, ассистент решил вспомнить старое-доброе — и сгенерировал сцену, где девушка с кружкой едет в поезде. Настоящий портрет созерцательной жизни, где нет ни детекторов, ни ИИ, ни копирайтерского труда… зато уют, граффити и немного московского настроения.

Поймать ассоциацию с моей статьёй возможно только по настойчивому желанию – похоже, нейросеть решила: «электричка была успехом, зачем рисковать ещё раз с абстракцией». Впрочем, теперь хотя бы всё понятно и по-русски. Вот только к теме статьи о проверке текстов искусственным интеллектом эта поездка всё так же не имеет никакого отношения.

Алиса решила, что копирайтеру важнее уют в электричке, чем темы ИИ и детекторов. Искусственный интеллект знает — отдыхать тоже надо!
Алиса решила, что копирайтеру важнее уют в электричке, чем темы ИИ и детекторов. Искусственный интеллект знает — отдыхать тоже надо!

Тест закончен: сюрреализм вместо иллюстраций

На этом эксперименты решено закончить — чувствую, что или я ставлю слишком простые задачи для новой Алисы Про, или искусственный интеллект Яндекса принципиально не любит очевидность. Может, генерация банальных иллюстраций — не уровень для сложных российских нейросетей, и стоит загружать в неё что-то вроде «визуализации смыслов».

В любом случае, выходит по-японски: загадка на каждый запрос, сюрприз на каждый результат, кракозябры вместо букв — и приятное ощущение, что ты тестируешь не помощника, а концепт-арт для научной фантастики.

Совет разрабам Яндекса — дайте Алисе шанс проявлять гениальность не только с неоном, но и по-русски. А пока для реальной редакторской работы проще добавить Comet в закладки и не мучиться с поисками латентного смысла в результатах от Алисы.

2
Начать дискуссию