Сборник терминов в области искусственного интеллекта и нейросетей

В процессе освоения нейронных сетей вы неизбежно встретите множество новых понятий, которые вам предстоит освоить. Поэтому рекомендую добавить эту статью в закладки — она окажется весьма полезной.
В случае, если вы столкнетесь с незнакомыми терминами в области искусственного интеллекта, у вас будет возможность углубиться в их изучение, ознакомившись с детальными разъяснениями в наших публикациях.

термины в области искусственного интеллекта

Искусственный интеллект - технология, которая дает возможность компьютерам осуществлять действия, для которых обычно необходим интеллект человека. Это включает в себя функции, такие как понимание речи, анализ естественного языка, обучение алгоритмов, вынесение суждений, создание визуального контента, редактирование изображений и многое другое.

Сильный искусственный интеллект - включает в себя возможности самоосознания, автономного обучения и решения задач, которые по сложности находятся на уровне человеческого мышления. Основная характеристика такого ИИ заключается в его способности самостоятельно формулировать цели и задачи, имея веские причины и намерения для их выполнения. Поскольку такой тип интеллекта пока не был разработан, опасения о восстании машин против человечества остаются неактуальными.

Нейронная сеть - представляет собой компьютерную систему, которая моделируется по принципу работы мозга человека и применяется для анализа и интерпретации различных данных, включая визуальные и текстовые информацию. В повседневном общении термин "нейросеть" часто употребляется как синоним "искусственного интеллекта", несмотря на то что они обозначают разные понятия.

Мы рады предложить вам уникальную возможность пройти бесплатный курс обучения, посвященный передовым нейронным сетям, включая ChatGPT, Stable Diffusion и Dalle-3. Для получения дополнительной информации, пожалуйста, перейдите по предоставленной ссылке: УЗНАТЬ О КУРСЕ ПОДРОБНЕЕ.

Генеративная нейросеть - представляет собой разновидность искусственных нейронных сетей, способных создавать новые образцы данных на основе изучения и обработки предоставленных ей обучающих материалов. К примеру, такая сеть может создавать изображения, исходя из текстового описания, что делает её генеративной.

Промпт - термин в нейросетях представляет собой текстовый запрос или указание, задача которого заключается в том, чтобы вызвать определенное действие или ответ со стороны искусственного интеллекта. Это текстовое обращение, которое пользователь направляет к нейросети с целью получения от нее определенного продукта, будь то статья, визуальный контент и так далее. В другом смысле, "промт" можно рассматривать как "инструкцию" для нейросети.
Как правильно писать промты мы разобрали в следующих статьях:

Как создать промт для ChatGPT - [ПРОЧИТАТЬ]
Как создать промт для Stable Diffusion - [ПРОЧИТАТЬ]

Негативный промпт — это инструкция, направленная на ограничение определённых действий или ответов со стороны искусственного интеллекта. К примеру, если в отрицательный промпт для нейросети Stable Diffusion включить слово "красный", то это не позволит ей применять красный цвет в процессе создания изображений. Подробно про негативные промты мы написали в статье:

негативный промт для нейросети Stable Diffusion

Доступ к нейросетям

Токен - является единичным элементом информации, применяемым при анализе и обработке естественных языков. Он может соответствовать слову, знаку или другому компоненту данных. Обычно, одно английское слово соответствует одному токену, пробел не учитывается как токен, а знаки пунктуации считаются отдельными токенами. В архитектуре нейросети, подобной ChatGPT, слова на русском и других неанглийских языках занимают больше токенов по сравнению с английским.

Волшебные токены - это токены, предлагаемые сервисами, которые перепродают услуги крупных организаций, включая OpenAi. Нередко такие сервисы искажают истинное значение слова "токен", вводя своих потребителей в замешательство. Иногда они устанавливают стоимость одного токена равной одному символу, что является некорректной заменой понятий. Обычно это делается с целью увеличения доходов за счет клиентов, которые не слишком хорошо ориентируются в области искусственного интеллекта.

Модель (чекпойнт) - представляет собой зафиксированный этап в развитии искусственного интеллекта или нейронной сети, который можно использовать для возобновления процесса обучения или его восстановления. К примеру, каждый отдельный чекпойнт в рамках нейросети, такой как Stable Diffusion, способен создавать визуализации в уникальных стилях и распознавать различных персонажей. Подробнее про модели, мы рассказали в статье - Модели для генерации в нейросети Stable Diffusion.

Denoising strength (DenS) - это характеристика, используемая в некоторых системах искусственного интеллекта, которая указывает на уровень удаления нежелательных артефактов из данных. К примеру, в технологии Stable Diffusion значение "СПШ" регулирует интенсивность изменений исходного изображения в режиме img2img. Чем больше значение Сила подавления шума, тем более заметными будут изменения в итоговом изображении после его обработки.

Img2img - представляет собой обширный термин в нейросетях, охватывающий множество техник для трансформации одного изображения в другое. К таким техникам относятся увеличение разрешения с добавлением отсутствующих пикселей, применение стилистических эффектов, Inpaint для заполнения пропущенных участков, OutPaint для расширения границ изображения, Scetch для создания эскизов и другие методы.

CFG Scale - это метрика, которая определяет уровень важности указаний, предоставленных пользователем. В контексте Stable Diffusion, более низкое значение CFG означает, что искусственный интеллект будет более внимательно следовать инструкциям промпта. При увеличении значения CFG, искусственный интеллект будет вносить больше собственных интерпретаций, включая изменения в цветовой гамме, яркости и других аспектах.

Сэмплер - представляет собой математический алгоритм или методику, применяемую для отбора и анализа информации с целью создания новых данных на основе распределения. В контексте Stable Diffusion сэмплер с математической стороны устанавливает способ обработки запроса пользователя. Различные сэмплеры применяются для достижения разнообразных целей, таких как ускорение процесса создания, улучшение точности воспроизведения, упрощение структуры текста и других.

DeepFace - является разработкой от компании Yes Ai, который предоставляет возможность замены и вставки различных лиц в изображения, генерируемые или изменяемые с помощью нейросети под названием Stable Diffusion.

ChatGPT — это продвинутая система искусственного интеллекта, ориентированная на создание текстов и общение в диалоговом формате, созданная разработчиками из OpenAI. В 2022 году эта технология сыграла ключевую роль в распространении знаний о нейронных сетях среди общественности.

Телеграм бот с ChatGPT

Stable Diffusion (SD) - инструмент на базе искусственного интеллекта, который позволяет создавать и изменять разнообразные изображения. Особенностью данной нейронной сети является её стремительное развитие, обусловленное открытым доступом к исходному коду, что дает возможность любому разработчику внести свой вклад в её усовершенствование.

INPAINT — это метод, применяющий машинное обучение для восстановления недостающих или испорченных сегментов на фотографиях. Эта техника не просто модифицирует отдельные элементы снимков, но и способна к их полной трансформации, что привело к увеличению количества дипфейков в интернете. Инструмент Inpaint мы разобрали в этой статье:

Изменение изображений с помощью stable diffusion inpaint

OutPaint — это инновационная система, применяющая мощь искусственного интеллекта для увеличения размеров фотографии за счет создания дополнительных деталей. Представьте, что у вас есть изображение с разрешением 1024 на 1024 пикселей. С помощью OutPaint можно увеличить его до, скажем, 1024 на 1600 пикселей, при этом система автоматически дополнит и впишет недостающие элементы и окружение, опираясь на существующие данные в исходном изображении.

LoRA (Low Rank Adaptation) - представляет собой технику оптимизации для тренировки искусственных нейронных сетей, которая обеспечивает возможность модификации модели с использованием параметров низкого ранга. В качестве примера, в нейросети Stable Diffusion, применение "LoRA" дает возможность обучить систему создавать изображения существ или предметов в стилях, которые не были изначально известны в основной модели, используемой для обучения (чекпойнте). Кроме того, LoRA в контексте Stable Diffusion способствует улучшению и расширению дополнительных функций, включая возможность регулировать такие аспекты, как длина волос, цвет кожи и другие характеристики персонажей, через корректировку весовых коэффициентов.
Подробная статья про LoRA - [ПЕРЕЙТИ]

ControlNet - представляет собой структуру искусственного интеллекта, разработанную для регулирования и синхронизации разнообразных компонентов, таких как элементы на визуальных материалах в рамках Stable Diffusion. Эта технология позволяет создавать карты текстур, глубины, позиций и другие. Используя эти карты, можно генерировать новые визуальные объекты, сохраняя определенные характеристики, например, одинаковые позы у людей и животных или сходные детали интерьера.

Текстовые инверсии (Embeddings) - это метод кодирования слов или фраз в виде точек в пространстве с высокой размерностью, применяемый для тренировки и функционирования систем обработки естественного языка. Эти векторные представления часто применяют для облегчения создания запросов и формулирования задач для моделей. Размер данных эмбеддингов значительно меньше по сравнению с полноценными моделями, однако их основной недостаток заключается в ограниченности: они не могут создавать на изображениях элементы, которые не были включены в исходный набор данных, на котором обучалась модель.

LLM (Large Language Model) - представляет собой продвинутую систему для работы с естественным языком, которая имеет возможность анализировать и создавать текст, опираясь на обширный набор информации. Программы вроде ChatGPT и аналогичные им используют технологию LLM для выполнения своих функций.

Dalle — это разработка OpenAI, представляющее собой систему искусственного интеллекта, которая умеет создавать визуальные произведения, исходя из текстовых инструкций. Отличительные черты этой модели (начиная с Dalle-3 и последующих версий) заключаются в ее интуитивной понятности, отличном восприятии деталей в описаниях, способности добавлять текст непосредственно на графические работы, а также в минимальном риске возникновения искажений или ошибок при визуализации рук.

SVD (Stable Video Diffusion) - представляет собой инновационный подход к созданию видео на основе изображений с помощью искусственного интеллекта. Уникальность данной системы заключается в ее способности не только распознавать содержимое начального изображения, но и придавать изображенным объектам последовательные и осмысленные движения, что делает процесс создания видео более контролируемым и предсказуемым.

Мы рассмотрели тему: "термины в области искусственного интеллекта", если вам понравилась данная статья, то будем благодарны вашему лайку и комментарию)

Телеграм бот с нейросетями Stable Diffusion, Dalle

Есть вопросы по нейросетям или по телеграм боту Yes Ai?
Пиши нам в техподдержку - Техподдержка Yes Ai

Подробнее о сервисе Yes Ai рассказываем в этом видео