Добро пожаловать в век ИИ
В своём канале я часто делюсь новостями про ИИ — от хайповых апдейтов до тихих, но мощных инструментов, которые могут реально упростить жизнь.
Недавно я публиковала гайд для тех, кто только подступается к теме искусственного интеллекта. Гайд классный, в нем просто и понятно описаны основы ИИ и самые известные на сегодня программы, где они используются. Но есть нюанс: как и почти всё на эту тему, он написан на английском. В ответ на свой пост я получила кучу сообщений с вопросом — а нет ли версии на русском?
Нет — не было. Но теперь будет!
Потому что я правда верю, что ИИ — это не страшно и не «только для айтишников». Это про инструменты, которые могут быть полезны каждому коллеге, аналитику, дизайнеру и даже ребенку и маме. Именно поэтому я решила перевести этот гайд и сделать его доступным тем, кто пока не готов читать длинные PDF'ки на английском.
Я не претендую на экспертизу опытного переводчика или редактора, лишь хочу помочь сделать важные знания более широко распространенными, чтобы в жизни каждого из нас стало чуточку больше магии.
В этом посте я привожу перевод первой главы книги, буду благодарна, если поддержите лайками и репостами мою работу, так я пойму, что стоит двигаться дальше.
От редактора
В течение нескольких коротких лет искусственный интеллект можно будет найти повсюду. В вашем телефоне, в веб-браузере, в поисковых системах, в вашем компьютере. Куда бы вы ни посмотрели, везде будет ИИ-помощник, предлагающий помощь.
Это новости могут вас совсем не обрадовать, если вы еще не освоили прелести новой активно развивающейся технологии. В этом руководстве вы узнаете, как начать работу со многими известными сервисами искусственного интеллекта. Мы рассмотрим ChatGPT, помощника Microsoft Copilot assistant, встроенного в Windows и офисные приложения компании, Apple Intelligence, множество инструментов Google для искусственного интеллекта и еще много чего интересного. Независимо от того, нужны ли вам быстрые ответы на вопросы, хотите получить готовые изображения или видео, расшифровать ваш разговор или даже попробовать ИИ-калькулятор - мы вам поможем!
Мы разбили это руководство на разделы, посвященные основным сервисам искусственного интеллекта, но в конце книги вы найдете руководство по альтернативным, только появляющимся, сервисам, а также простые инструкции, как вы можете создать свои собственные чат-боты с искусственным интеллектом. Это проще, чем вам кажется.
В этом руководстве мы будем приводить подсказки, которые вы сможете использовать, чтобы извлечь максимум пользы из новых помощников.
🗨 Создай изображение воздушного шара в форме лампочки
Когда вы увидите что-либо в указанном выше формате, это конкретный пример промпта (команды) для ИИ программы. У нас также будут пошаговые инструкции, которые покажут вам, как создавать проекты, от планирования вечеринки до создания дизайна. Если вам давно было "очень интересно", но вы не понимали, как сделай первый шаг в это чудный новый мир, надеюсь, это руководство покажется вам правильную дорогу.
Введение в мир Искусственного интеллекта
Хотите узнать как на самом деле работает самая популярная сейчас технология? И как вы можете воспользоваться этим чудом человеческого ума? Тогда вы по адресу. К тому же мы поделимся советами, которые помогут вам тратить на них как можно меньше — а может, вообще ничего.
Как работают ИИ системы - узнаем как создается волшебство
Искусственный интеллект (AI) — это обобщённый термин, который используется для описания всех видов действий, выполняемых компьютерами. На самом деле, в последние годы этот термин часто используют слишком широко: то, что раньше называли просто «программным обеспечением» или «алгоритмами», теперь стали переименовывать в AI — потому что так это звучит более продвинуто… и за это можно брать больше денег.
У AI нет единого объяснения того, как он работает: существует множество различных типов ИИ, и в этом гайде мы рассмотрим большую их часть. Мы объясним, как работают три основных типа ИИ:
· большие языковые модели (LLMs), такие как ChatGPT,
· сервисы распознавания речи,
· и модели генерации изображений.
Конечно, все эти системы очень сложные, но мы постараемся объяснить их работу максимально простым и понятным языком — чтобы вы точно понимали, что происходит, когда вы даёте ИИ какую-либо задачу.
Большие языковые модели (LLMs)
Сервисы вроде ChatGPT, Microsoft Copilot и Google Gemini имеют одно общее: они основаны на больших языковых моделях. У ChatGPT и Copilot это часто даже одни и те же модели.
LLMs — это компьютерные программы, созданные для понимания и генерации человеческой речи. Их часто сравнивают с системами автодополнения текста, которые вы используете при наборе сообщений на смартфоне — потому что они тоже предсказывают слова и фразы, которые должны следовать дальше.
Как они это делают? Им "скармливают" миллионы страниц текста из книг, газет, сайтов и других источников. Обрабатывая всё это, LLM учится делать весьма обоснованные предположения о том, какие слова обычно идут вместе.
Например, если ввести фразу: «Январь — это очень мокрый и холодный...», большинство людей подставит слово «месяц». Почти нигде вы не найдёте: «Январь — это очень мокрый и холодный хомяк» (хотя получается сейчас нашли). Именно так ИИ делает прогноз на основе огромной базы данных шаблонов и связей, полученных во время обучения.
Что удивительно, LLM делает это почти самостоятельно. Она сама учится читать и писать на разных языках, а инженеры лишь корректируют её на финальной стадии.
Раньше это означало, что знание таких сервисов, как ChatGPT, ограничивалось последней датой обучения. Например, он мог долго отвечать, что Борис Джонсон — премьер-министр Великобритании, даже после его отставки. Теперь же большинство чат-ботов может подключаться к интернету, чтобы узнавать последние события. Но есть и минус: они могут ошибаться, ведь всё, что они "знают", — это то, что им сообщили.
LLMs часто сравнивают с системами автодополнения текста, которые вы используете при наборе сообщений на смартфоне.
Сервисы распознавания речи (транскрибации)
Многие ИИ-сервисы, о которых мы расскажем в этом гайде, предлагают услуги распознавания и транскрибации аудио. Будь то возможность говорить напрямую с сервисами вроде ChatGPT или автоматическое получение расшифровки встреч с помощью таких инструментов, как Otter, — ИИ буквально понимает, о чём вы говорите.
Эти сервисы работают похожим образом на LLM. ИИ разбивает аудио на базовые звуковые единицы — фонемы, например: «oo», «ta», «sh». Затем, используя огромный массив обучающих аудиоданных, он комбинирует эти фонемы, чтобы предсказать, какое слово было произнесено.
Когда слова звучат похоже, ИИ использует вероятностный анализ, чтобы угадать, что именно имелось в виду. Например, фраза «у моей кошки чёрно-белая шерсть» гораздо более вероятна, чем «у моей кошки чёрно-белая кость».
Разумеется, эти сервисы не идеальны. Даже самые продвинутые из них совершают ошибки, особенно при работе с сильными или необычными акцентами, а также со сложным или редким жаргоном. Однако такие технологии постоянно совершенствуются — сегодня они уже могут распознавать и называть отдельных говорящих.
Модели генерации изображений
Одна из самых впечатляющих возможностей ИИ — это когда вы вводите простой текстовый запрос, например «медведь, облизывающий лапы», и в ответ появляется картинка. Интересно как ИИ это делает?
Он начинает почти так же, как и в случае с текстом или аудио — с огромного количества обучающих данных. ИИ обучается на миллионах изображений, которые снабжены текстовыми описаниями того, что на них изображено. То есть, когда ИИ видит тысячи изображений медведей, он начинает «запоминать» их характеристики — как они обычно выглядят. Он «знает», что у медведя может быть всего несколько типичных цветов: например, полярный медведь, скорее всего, будет белым, а коала-медведь — серо-коричневым.
При этом ИИ не знает, что такое когти или цвета в человеческом смысле, но он умеет назначать им математические представления — и, когда его просят нарисовать медведя, он применяет эти характеристики.
Генерация изображений обычно использует так называемую диффузионную модель: она начинает с размытого, грубого изображения и постепенно улучшает его, пока не получится финальный результат.
На некоторых платформах, таких как Midjourney, вы можете буквально наблюдать за этим процессом: изображение, которое вы запросили, постепенно проясняется — как будто вы крутите объектив камеры, чтобы навести резкость.
Генерация видео тоже становится всё более распространённой и работает по схожему принципу. Но поскольку видео — это по сути много отдельных кадров, собранных в последовательность, ИИ нужно гораздо больше времени, чтобы создать движущееся изображение, чем один статичный кадр. Именно поэтому вы чаще всего видите, что ИИ-сервисы выдают очень короткие видео — всего на несколько секунд.
10 советов, как получить максимум от ИИ
Основной рецепт магии - в правильных запросах. В этом разделе мы расскажем, как их делать.
Команды, которые вы даёте ИИ-инструментам — так называемые промпты — очень важная часть процесса. Плохо сформулированные запросы часто приводят к плохим результатам или заставляют тратить больше времени на достижение нужного эффекта.
10 советов, которые помогут вам улучшить свои промпты и улучшить свой опыт работы с разными ИИ-инструментами.
1. Будьте максимально точными
ИИ работает лучше, когда всё чётко. Чем точнее вы формулируете запрос, тем выше шанс получить желаемый результат.
Например, если мы хотим, чтобы сервис генерации изображений создал нечто похожее на «Мону Лизу», такой запрос плохой:
🗨 Женщина с лёгкой улыбкой.
Мы не сообщили ИИ ничего: ни внешность женщины, ни её возраст, ни что находится на фоне. Хороший запрос будет гораздо более детальным:
🗨 Картина маслом, изображающая молодую белую женщину. У неё тёмно-каштановые прямые волосы до плеч, она в струящемся чёрном платье с золотисто-коричневыми рукавами. У неё мягкая кожа, спокойное выражение лица и загадочная полуулыбка. Портрет в полный рост, на фоне красивого пейзажа.
Вторая картинка, полученная по такому запросу, хоть и не является точной копией «Моны Лизы», но гораздо ближе к оригиналу, чем первая, созданная по короткому промпту (обе сделали через Midjourney).
2. Опишите желаемый результат
Если вы знаете (хотя бы примерно) какой результат хотите получить — скажите ИИ об этом. Например:
🗨 Сформулируй краткое содержание этого письма в пяти пунктах.
🗨 Сгенерируй изображение кота, лежащего на солнце, в формате 4:3.
3. Дайте контекст
Чем больше вы сообщаете ИИ о том, зачем вам нужен результат, тем лучше он его проработает. Например, второй запрос гораздо точнее первого:
🗨 Объясни, как работает каталитический нейтрализатор.
🗨 Объясни, как работает каталитический нейтрализатор, человеку, который не имеет технических знаний.
4. Повторяйте запросы (делайте итерации)
Если вы просите ИИ сделать что-то относительно сложное, вряд ли вы получите идеальный результат с первой попытки. Не бойтесь начать с простого запроса и постепенно уточнять его, чтобы прийти к нужному результату. Например:
🗨 Напиши резюме на 500 слов о Фолклендской войне и её влиянии на отношения между Великобританией и Аргентиной.
После этого можно уточнить:
🗨 Сделай упор на волеизъявлении жителей Фолклендских островов и их отношении к конфликту.
5. Покажите ИИ, чего вы хотите
Генераторы изображений часто позволяют загружать референсные картинки, чтобы подсказать ИИ стиль, в котором вы хотите получить результат.
Например, мы загрузили изображение пары, идущей по пляжу, в ChatGPT и далее задали запрос:
🗨 Сгенерируй изображение в этом стиле, но с парой, идущей по холму.
Это не совсем тот же пиксельно-растянутый эффект, но результат довольно близкий.
6. Общайтесь с ИИ, как с человеком
Разговаривайте с ИИ так, как вы бы общаетесь с настоящим помощником или коллегой. Он отлично воспринимает обратную связь и инструкции, сформулированные простыми словами. Например, вы создаёте приложение, но вам не нравится иконка, которую предложил ИИ. Вы можете сказать:
🗨 Приложение выглядит здорово, но можем ли мы поменять иконку? Сделай сову более мультяшной, дружелюбной и менее реалистичной.
Вы даже можете попросить ИИ самому задавать уточняющие вопросы, если ему нужно прояснить идею:
🗨 Не стесняйся задавать мне дополнительные вопросы, если не уверен, как это должно выглядеть.
7. Не доверяй ему полностью
Точность ИИ улучшается, но он всё ещё далёк от идеала. Если вопрос важный, обязательно проверь результат. Если ИИ находит ответ в интернете, он часто даёт ссылки на источники, чтобы вы могли проверить, откуда взята информация (хотя и это не гарантия, что она верная — но хотя бы вы сможете сами оценить её надёжность).
Если ИИ даёт расчёты, попробуйте перепроверить хотя бы часть вручную, чтобы убедиться в точности результата.
8. Пробуйте разные сервисы
Сейчас существует огромное количество ИИ-сервисов, и многие из них бесплатны — нет смысла ограничиваться только одним. Если, например, ChatGPT не даёт нужного результата, попробуйте тот же запрос в Google Gemini и посмотрите, станет ли результат лучше. Аналогично, генераторы изображений тоже имеют свои сильные и слабые стороны. Midjourney отлично справляется с фотореализмом, но, скажем, не так хорош в работе с текстом, как ChatGPT.
9. Будьте готовы к изменениям
ИИ-инструменты постоянно обновляются, и это влияет на то, как они работают. Запрос, который сегодня дал отличный результат, завтра может сработать хуже.
Если вы пользуетесь каким-то конкретным инструментом, следите за обновлениями на сайте разработчика — там часто публикуют, что изменилось и как теперь формулировать запросы, чтобы получать хорошие результаты.
10. Ищите вдохновение у других
Многие ИИ-сервисы, особенно генераторы изображений и видео, показывают примеры работ, созданных другими пользователями. Вы можете копировать их промпты и адаптировать под свои задачи.
На промпты не распространяется авторское право, так что не стоит переживать, будто вы крадёте чью-то интеллектуальную собственность.
Как сэкономить на AI-сервисах
Сейчас существует огромное количество ИИ-сервисов, но многие из них платные за все, что выходит за рамки базовых функций. Не заметив, вы можете «подсесть» на пару таких сервисов и тратить тысячи рублей в год на подписки.
Однако есть способы свести расходы к минимуму — а если ваши задачи достаточно простые и вы готовы немного поэкспериментировать с разными инструментами, то можно и вовсе обойтись без затрат. В это разделе мы собрали лайфхаки, которые помогут вам не разориться во время AI-революции.
Пользуйтесь бесплатными тарифами
Почти у каждого ИИ-сервиса есть бесплатный тариф. Да, он может не включать все новейшие функции и модели, и у него есть ограничения, но если вы используете ИИ не слишком активно, вам скорее всего не придётся даже вводить данные своей банковской карты.
**прим ред.: Также эти варианты актуальны, если у вас нет банковских карт иностранных банков, которые необходимы для оплаты подобных сервисов
Ограничения использования часто не обозначены чётко. Например, редко когда сервис прямо говорит: «вы можете сделать только 10 запросов бесплатно». ИИ-платформы обычно снижают лимиты в периоды высокой нагрузки, и эти лимиты могут зависеть от длины вашего запроса и ответа. Если вы просите ИИ написать сотни строк кода — лимит может закончиться быстрее, чем если вы просто задаёте короткий вопрос.
Даже если у вас закончились бесплатные кредиты в одном сервисе, вы можете переключиться на другой. Например, ChatGPT и Microsoft Copilot используют одни и те же технологии, поэтому если лимит исчерпан в одном, можно использовать другой — и получить схожее качество ответов.
Ограничения чаще всего не суточные или месячные, а поминутные/почасовые. Часто сервис просто просит «вернуться позже». Так что не переживайте, если проект прервался — скорее всего, всё продолжится через пару часов.
Обычным пользователям ИИ вообще можно обойтись бесплатными тарифами.
Внимательно формулируйте свои запросы
Если вы пользуетесь бесплатным тарифом (или даже платным, но с лимитами), внимательно относитесь к формулировкам промптом (запросов). Не забываем про 10 советов, которые собраны выше, и проверяем, что вы указываете достаточно деталей и чётко обозначаете, какого формата и стиля ожидаете ответ.
Чем больше вы будете переформулировать и уточнять запросы, тем быстрее потратите бесплатные кредиты. Поэтому не торопитесь: сразу старайтесь составить запрос как можно точнее.
Используйте мульти-модальные сервисы
Существуют ИИ-сервисы, которые специализируются на текстах, другие — на изображениях и видео, а некоторые — на аудио.
Если вы хотите сэкономить на подписках, выбирайте сервис «на все случаи жизни». Например, ChatGPT умеет генерировать текст, изображения и видео, а также анализировать документы, таблицы и другие файлы. У Google Gemini те же возможности, плюс он ещё умеет распознавать аудио.
Возможно, такие универсальные инструменты не всегда настолько же хороши, как узкоспециализированные сервисы, но если вы можете платить только за один из них — мульти-модальные решения дадут вам максимальную отдачу за свои деньги.
Используйте менее ресурсоёмкие модели
Даже у платных подписчиков ChatGPT есть ограничения на использование, и они расходуются быстрее, если вы используете самые новые ИИ-модели или продвинутые функции.
В целом, чем мощнее модель, тем больше она требует вычислительных ресурсов — а значит, и тем быстрее вы потратите свой лимит. Но есть так называемые "мини"-модели, которые потребляют меньше ресурсов, и вы можете использовать их более свободно.
На момент написания этого руководства в ChatGPT были доступны:
- модель o3 — для «глубокой логики»
- и модель o4-mini, которая описывается как «самая быстрая для сложных рассуждений».
Так что если вам нужна глубокая аналитика, но вы уже близки к исчерпанию лимитов, можно в выпадающем списке (в верхней части экрана) выбрать o4-mini. Качество ответа часто практически не страдает, даже по сравнению с более мощными моделями.
Обратите внимание на черновые режимы (Draft options)
Генератор изображений Midjourney — один из сервисов, который устанавливает лимиты даже для платных пользователей. Если вы приближаетесь к лимиту, но вам всё ещё нужны изображения, попробуйте использовать режим Draft, который появился в версии 7.
В Draft-режиме изображения обычно создаются быстрее и с меньшими затратами вычислительных ресурсов — отлично подходит для экспериментов с разными запросами, пока не найдёте что-то подходящее. Например, мы можем попробовать несколько разных вариантов одной и той же идеи, прежде чем найдём тот, что нас устраивает — и всё это в разы дешевле, чем в обычном (Standard) режиме.
Когда вы получите подходящее изображение, можно нажать Enhance, чтобы повысить его качество и разрешение.
Другие сервисы предлагают похожие опции. Например, в видеогенераторе Sora от ChatGPT можно выбрать, сколько вариантов вы хотите получить на один запрос. Если вы готовы рискнуть и выбрать только один вариант, вы потратите гораздо меньше видео-кредитов, чем если бы просили сразу два или четыре.
Снова всё сводится к тому, чтобы максимально точно сформулировать промпт с самого начала.
В следующей главе мы разберем Open AI и их Chat GPT, который стал синонимом ИИ. Поддержите мою работу вашими лайками и репостами, а также поделитесь в комментариях, как вы улучшаете свою работу с промптами и какие ИИ-сервисы используете и как часто?