Ты просто робот, имитация жизни

Считается, что уже в недалёком будущем во во многих областях машинный труд заменит ручной, и останутся только «креативные» профессии. В последнее время методы машинного обучения прогрессируют настолько быстро, что этот тезис кажется уже не таким незыблемым.

Ты просто робот, имитация жизни

Я решил проверить, может ли робот написать симфонию, сделать шедевр сделать что-то такое, что до сих пор считалось неподвластным машине. Например, написать детскую книжку.

Начало

Совсем недавно вышла ChatGPT от Open AI и сразу взорвала интернет — появилось много статей, как люди задают сети разные задачи, а она довольно качественно генерирует ответы. Примеры: Я попросил ChatGPT написать требования, и вот что получилось, Копирайтерам на выход с вещами? и еще несколько статей про успехи ChatGPT.

Я и сам попросил ChatGPT написать посты для канала нашей компании. И пост на тему развития NoCode-платформ у ChatGPT получился примерно такой же, как у меня самого. Ну и конечно, я попросил написать код большого куска функционала, на что ChatGPT ответил, что код написать не может, но решение по шагам расписал. Это очень впечатляет.

Еще одним впечатляющим открытием последнего времени стали Midjourney и DALL-E от того же OpenAI. Это сети, создающие картинки по описанию. Интернет сейчас переполнен результатами их работы. Например, недавно я увидел пост о том, как мог бы выглядеть iPhone, изобретенный в СССР:

Ты просто робот, имитация жизни

Получается, дизайнеры могут вдохновляться картинками, сгенерированными сетью, а потом дополнять их. С другой стороны, можно сгенерировать текст по запросу.

Я решил попробовать попросить ChatGPT написать короткую детскую книжку, затем к каждому абзацу сделать иллюстрацию с помощью Midjourney / DALL-E, а потом перевёл с английского с помощью Google-переводчика. Вот, что из этого вышло.

Текст для книжки

Для начала нужно сгенерировать текст. Я выбрал именно детскую книжку для совсем маленьких детей, потому что обычно в таких книжках нет глубокого смысла и они рассказывают о каком-то небольшом событии из жизни главного героя. Как правило, книжки совсем короткие и красочно иллюстрированые. Иллюстрации, кажется, даже важнее текста. Отличная задачка для ChatGPT.

Выбираем главного героя. Пусть это будет зайчик, дети их любят. На этом креатив заканчивается и к работе приступает ChatGPT. С третьего раза по запросу вида “Generate a short story about bunny for children” я получил рассказ, который взял для дальнейшей работы. На самом деле можно было брать хоть первый сгенерированный текст, они все были примерно одинаковы.

Вот, что получилось:

Once upon a time, in a green meadow surrounded by tall trees, there lived a little rabbit named Binky. Binky was a curious and energetic rabbit, and he loved nothing more than exploring the meadow and all the nooks and crannies of the forest.

One day, Binky decided to go on an adventure. He packed a small bag with some carrots and set off into the forest. As he hopped through the underbrush, he saw all sorts of amazing sights - birds singing in the trees, a babbling brook, and even a family of deer grazing in a clearing.

As he wandered further and further into the forest, Binky started to get a little bit tired. He had been hopping for hours, and his feet were starting to feel sore. Just when he was thinking about turning back, he saw a bright, shiny object glinting in the sunlight.

Binky couldn't resist the temptation to investigate, and he hopped over to the object to see what it was. As he got closer, he realized it was a beautiful golden carrot, shining brightly in the sun.

Binky couldn't believe his luck - he had never seen a carrot like this before! He knew he had to take it home with him, so he carefully picked it up and placed it in his bag.

As he hopped home, Binky couldn't stop thinking about the golden carrot. He knew it would make the perfect gift for his friends and family, and he couldn't wait to show it off.

When Binky arrived home, his friends and family were amazed by the golden carrot. They had never seen anything like it before, and they all wanted to know where Binky had found it.

Binky told them all about his adventure in the forest, and how he had found the carrot shining in the sun. His friends and family were so impressed by his bravery and curiosity that they decided to throw him a big celebration.

And so, Binky the rabbit became known as the bravest and most adventurous rabbit in the meadow, and he lived happily ever after, always ready for his next great adventure.

ChatGPT

Если коротко, то сеть сгенерировала рассказ о зайчике, который отправился в путешествие и, когда уже собирался идти обратно, наконец наткнулся на невиданную раньше золотую морковку. Он забрал ее с собой и вернулся к своей семье и друзьям. Они были шокированы и устроили праздник, а сам зайчик стал считаться самым храбрым и предприимчивым на своей полянке.

Вполне неплохо для детского рассказа. Остается «нарисовать» красивые иллюстрации.

Создаем иллюстрации

Эта задачка оказалась чуть сложнее, чем я думал сначала. Я решил отгружать сети текст по абзацам, как это делается в детских книжках: короткий текст и большая иллюстрация.

Но, видимо, абзацы были слишком большими, поэтому картинки получались не очень. Например, если просто скормить первый абзац сети DALL-E, можно получить такую картинку:

Ты просто робот, имитация жизни

Поэтому я решил сокращать текст абзацев, оставляя только самую суть. Получалось уже лучше:

Ты просто робот, имитация жизни

Но на многих картинках «лицо» кролика получалось искаженным или возникали разные артефакты, например, отсутствовали глаза или рука. Такое детям лучше не показывать. Благо в DALL-E есть возможность сгенерировать другие варианты на основе картинки. Например, по картинке выше с ..-го раза у меня создался вполне качественный вариант:

Ты просто робот, имитация жизни

Но когда я начал делать картинки для следующих абзацев, понял, что очень сложно связать их в единый стиль. Сеть постоянно генерировала разные варианты. Кролик был то одного цвета, то другого, стиль картинки часто отличался:

Ты просто робот, имитация жизни

Поэтому я решил немного уточнять запросы, приписывая стиль “digital art” в конце запроса и делая всякие заметки типа цвета кролика.

Также я пошел на небольшие хитрости. Например, в абзаце про то, как кролик находит золотую морковку, совсем не обязательно показывать его самого. А на картинках, где кролик идет в лес, можно показывать его со спины, чтобы исключить искажения мордочки.

Еще я генерировал много вариантов каждого абзаца, чтобы находить наиболее «синхронизированные» между собой картинки. Но в итоге мне понадобилось около 100 картинок, чтобы получить приемлемый результат. Впрочем, я пользовался этой штукой в первый раз и уверен, что, уточняя запросы, можно сделать картинки более качественно и быстро.

Кстати, для генерации некоторых картинок я использовал Summarizer от самого OpenAI. А еще можно попросить ChatGPT сформировать запрос для DALL-E:

Ты просто робот, имитация жизни

Перевод и результаты

После совмещения всех картинок я получил такой текст:

Once upon a time, in a green meadow surrounded by tall trees, there lived a little rabbit named Binky. Binky was a curious and energetic rabbit, and he loved nothing more than exploring the meadow and all the nooks and crannies of the forest.

One day, Binky decided to go on an adventure. He packed a small bag with some carrots and set off into the forest. As he hopped through the underbrush, he saw all sorts of amazing sights - birds singing in the trees, a babbling brook, and even a family of deer grazing in a clearing.

Ты просто робот, имитация жизни

As he wandered further and further into the forest, Binky started to get a little bit tired. He had been hopping for hours, and his feet were starting to feel sore. Just when he was thinking about turning back, he saw a bright, shiny object glinting in the sunlight.

Binky couldn't resist the temptation to investigate, and he hopped over to the object to see what it was. As he got closer, he realized it was a beautiful golden carrot, shining brightly in the sun.

Ты просто робот, имитация жизни

Binky couldn't believe his luck - he had never seen a carrot like this before! He knew he had to take it home with him, so he carefully picked it up and placed it in his bag.

Ты просто робот, имитация жизни

As he hopped home, Binky couldn't stop thinking about the golden carrot. He knew it would make the perfect gift for his friends and family, and he couldn't wait to show it off.

When Binky arrived home, his friends and family were amazed by the golden carrot. They had never seen anything like it before, and they all wanted to know where Binky had found it.

Ты просто робот, имитация жизни

Binky told them all about his adventure in the forest, and how he had found the carrot shining in the sun. His friends and family were so impressed by his bravery and curiosity that they decided to throw him a big celebration.

And so, Binky the rabbit became known as the bravest and most adventurous rabbit in the meadow, and he lived happily ever after, always ready for his next great adventure.

Ты просто робот, имитация жизни

Осталось только прогнать этот текст через Google-переводчик. Получилось довольно качественно, если не учитывать некоторые расхождения с родом зайчика (то «он», то «она») и некоторых неказистых оборотах речи типа «заняться расследованием» вместо «разузнать».

Вместо вывода

Хочется завершить статью рассуждением о будущем машинного обучения и творчества. Надо сразу сказать, что я считаю искусственный интеллект недосягаемым на данный момент. И неоднократно спорил на эту тему со своим товарищем (мы оба «технари» и защищали дипломы по темам, связанным с машинным обучением и автоматизированной обработкой данных).

Искусственный интеллект (по Википедии) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека. Ключевое здесь — творческие функции. То есть, в моем понимании, такой интеллект должен осознать сам себя, уметь учиться решать задачи, которых он никогда раньше не видел, как ребенок, выполнять креативную работу, творить — создавать новое. При этом то, что существует сейчас — методы машинного обучения, которые «обучены» решать (пусть и очень качественно) конкретные задачи. И даже впечатляющие результаты того же ChatGPT и DALL-E — всего лишь решения конкретных задач, а модели обучены на огромном массиве данных. Хотя, я уже не уверен…

Мой товарищ, с другой стороны, считает, что это и есть путь к повторению интеллекта. Его аргумент в том, что человек также обучается и формирует свои нейронные связи, которые в конечном счете создают ассоциации и в том числе возможность производить что-то новое из этих ассоциаций. Человек ведь тоже, по распространенному мнению, творит через синергию своего опыта в разных сферах деятельности и ощущений. То есть комбинирует то, что уже где-то видел (испытывал в более общем смысле), или по крайней мере что-то из ранее испытанного наталкивает или вдохновляет его на собственное творчество.

Ну а раз работу мозга можно упрощенно представить, как перемещение электрических импульсов, проходящих по выстроенным нейронным связям, то получается, что достаточно большого количества данных и времени, а также механизм построения системы импульсов, схожий с человеческим, чтобы воспроизвести человеческое мышление — и мы, получим настоящий искусственный интеллект. Ведь именно на этом базируются все предположения о нейронных сетях с прошлого века, а теперь появляются достаточные мощности чтобы обучать сети на огромных данных достаточно быстро.

А как вы считаете, ведет ли текущий курс развития машинного обучения к искусственному интеллекту?

4646
86 комментариев

Вот вопрос только один. А для кого это все будут писать и делать нейронки? Ну допустим 80% людей заменят машины. Вместо них машины будут делать все: от уборки улиц, копания шахт, до написания музыки и книжек. А для кого это? Для оставшихся 20%? Это утопия. Лучше бойтесь цифрового лагеря, рубля и подобного, а не того, что нейронка теперь сказку вместо писателя составит. К тому моменту, когда будет цифровой лагерь, потребность в сказках и музыке от нейронки будет на уровне нуля.

7
Ответить

Нейросети - это всего лишь инструмент, которым надо точно так же учиться пользоваться, и который составляет только часть производственной цепочки.

Просто вместо стилуса художники будут работать на более высоком уровне и с более высокой производительностью, но и требования к качеству пропорционально возрастут.

5
Ответить

Комментарий недоступен

Ответить

Возможно, что эти процессы идут параллельно и где-то местами соприкасаются, взаимоусиливая друг друга, цифровой рубль, цифровой лагерь, цифровая литература и т.д.

1
Ответить

Да откуда вывод про 80%? Того, что сейчас умеют нейронки в прямых руках, уже достаточно, чтобы заменить станочников вроде Донцовой (при всём моём к ней уважении как к человеку, умеющему отлично продавать свои книги). И это замечательно — рынок в перспективе может очиститься от ширпотреба, а талантливых авторов как покупали, так и будут.

Низкоквалифицированные профессии, в какой-то момент ставшие ненужными — это обычное явление в новейшей истории. Луддиты, кстати, тоже)) И ничего, прогресс идёт, а рабочих мест не сказать что убавляется. Негодуют разве что вчерашние выпускники онлайн-курсов, верящие в быстрый большой заработок с нуля. Но к счастью, это лечится)

1
Ответить

Технологическая безработица это нормально и всегда так было. Заменит машина 80% профессий, люди займут новые ниши. Прям при таком апокалиптичном сценарии все будут пахать на нейронки - будет тренер моделей, менеджер нейронных сетей, продаван нейроконтента, отладчик нейросетей, специалист по робо-этике. Что-нибудь да придумается. Отдельно будет за большие деньги коллекционная ручная работа :) Расскажи людям из СССР что тебе будут платить большие деньги за то что ты ешь на камеру - никто не поверит.

Правда я всё равно не верю, что нейронки угрожают сферам типа программирования или рисования, но я задолбался про это писать :)

1
Ответить

так население в странах падает

Ответить