Сборник терминов в области искусственного интеллекта и нейросетей
Токен - является единичным элементом информации, применяемым при анализе и обработке естественных языков. Он может соответствовать слову, знаку или другому компоненту данных. Обычно, одно английское слово соответствует одному токену, пробел не учитывается как токен, а знаки пунктуации считаются отдельными токенами. В архитектуре нейросети, подобной ChatGPT, слова на русском и других неанглийских языках занимают больше токенов по сравнению с английским.
Волшебные токены - это токены, предлагаемые сервисами, которые перепродают услуги крупных организаций, включая OpenAi. Нередко такие сервисы искажают истинное значение слова "токен", вводя своих потребителей в замешательство. Иногда они устанавливают стоимость одного токена равной одному символу, что является некорректной заменой понятий. Обычно это делается с целью увеличения доходов за счет клиентов, которые не слишком хорошо ориентируются в области искусственного интеллекта.
Модель (чекпойнт) - представляет собой зафиксированный этап в развитии искусственного интеллекта или нейронной сети, который можно использовать для возобновления процесса обучения или его восстановления. К примеру, каждый отдельный чекпойнт в рамках нейросети, такой как Stable Diffusion, способен создавать визуализации в уникальных стилях и распознавать различных персонажей. Подробнее про модели, мы рассказали в статье - Модели для генерации в нейросети Stable Diffusion.
Denoising strength (DenS) - это характеристика, используемая в некоторых системах искусственного интеллекта, которая указывает на уровень удаления нежелательных артефактов из данных. К примеру, в технологии Stable Diffusion значение "СПШ" регулирует интенсивность изменений исходного изображения в режиме img2img. Чем больше значение Сила подавления шума, тем более заметными будут изменения в итоговом изображении после его обработки.
Img2img - представляет собой обширный термин в нейросетях, охватывающий множество техник для трансформации одного изображения в другое. К таким техникам относятся увеличение разрешения с добавлением отсутствующих пикселей, применение стилистических эффектов, Inpaint для заполнения пропущенных участков, OutPaint для расширения границ изображения, Scetch для создания эскизов и другие методы.
CFG Scale - это метрика, которая определяет уровень важности указаний, предоставленных пользователем. В контексте Stable Diffusion, более низкое значение CFG означает, что искусственный интеллект будет более внимательно следовать инструкциям промпта. При увеличении значения CFG, искусственный интеллект будет вносить больше собственных интерпретаций, включая изменения в цветовой гамме, яркости и других аспектах.
Сэмплер - представляет собой математический алгоритм или методику, применяемую для отбора и анализа информации с целью создания новых данных на основе распределения. В контексте Stable Diffusion сэмплер с математической стороны устанавливает способ обработки запроса пользователя. Различные сэмплеры применяются для достижения разнообразных целей, таких как ускорение процесса создания, улучшение точности воспроизведения, упрощение структуры текста и других.
DeepFace - является разработкой от компании Yes Ai, который предоставляет возможность замены и вставки различных лиц в изображения, генерируемые или изменяемые с помощью нейросети под названием Stable Diffusion.
ChatGPT — это продвинутая система искусственного интеллекта, ориентированная на создание текстов и общение в диалоговом формате, созданная разработчиками из OpenAI. В 2022 году эта технология сыграла ключевую роль в распространении знаний о нейронных сетях среди общественности.
Stable Diffusion (SD) - инструмент на базе искусственного интеллекта, который позволяет создавать и изменять разнообразные изображения. Особенностью данной нейронной сети является её стремительное развитие, обусловленное открытым доступом к исходному коду, что дает возможность любому разработчику внести свой вклад в её усовершенствование.
INPAINT — это метод, применяющий машинное обучение для восстановления недостающих или испорченных сегментов на фотографиях. Эта техника не просто модифицирует отдельные элементы снимков, но и способна к их полной трансформации, что привело к увеличению количества дипфейков в интернете. Инструмент Inpaint мы разобрали в этой статье:
OutPaint — это инновационная система, применяющая мощь искусственного интеллекта для увеличения размеров фотографии за счет создания дополнительных деталей. Представьте, что у вас есть изображение с разрешением 1024 на 1024 пикселей. С помощью OutPaint можно увеличить его до, скажем, 1024 на 1600 пикселей, при этом система автоматически дополнит и впишет недостающие элементы и окружение, опираясь на существующие данные в исходном изображении.
LoRA (Low Rank Adaptation) - представляет собой технику оптимизации для тренировки искусственных нейронных сетей, которая обеспечивает возможность модификации модели с использованием параметров низкого ранга. В качестве примера, в нейросети Stable Diffusion, применение "LoRA" дает возможность обучить систему создавать изображения существ или предметов в стилях, которые не были изначально известны в основной модели, используемой для обучения (чекпойнте). Кроме того, LoRA в контексте Stable Diffusion способствует улучшению и расширению дополнительных функций, включая возможность регулировать такие аспекты, как длина волос, цвет кожи и другие характеристики персонажей, через корректировку весовых коэффициентов.
Подробная статья про LoRA - [ПЕРЕЙТИ]
ControlNet - представляет собой структуру искусственного интеллекта, разработанную для регулирования и синхронизации разнообразных компонентов, таких как элементы на визуальных материалах в рамках Stable Diffusion. Эта технология позволяет создавать карты текстур, глубины, позиций и другие. Используя эти карты, можно генерировать новые визуальные объекты, сохраняя определенные характеристики, например, одинаковые позы у людей и животных или сходные детали интерьера.
Текстовые инверсии (Embeddings) - это метод кодирования слов или фраз в виде точек в пространстве с высокой размерностью, применяемый для тренировки и функционирования систем обработки естественного языка. Эти векторные представления часто применяют для облегчения создания запросов и формулирования задач для моделей. Размер данных эмбеддингов значительно меньше по сравнению с полноценными моделями, однако их основной недостаток заключается в ограниченности: они не могут создавать на изображениях элементы, которые не были включены в исходный набор данных, на котором обучалась модель.
LLM (Large Language Model) - представляет собой продвинутую систему для работы с естественным языком, которая имеет возможность анализировать и создавать текст, опираясь на обширный набор информации. Программы вроде ChatGPT и аналогичные им используют технологию LLM для выполнения своих функций.
Dalle — это разработка OpenAI, представляющее собой систему искусственного интеллекта, которая умеет создавать визуальные произведения, исходя из текстовых инструкций. Отличительные черты этой модели (начиная с Dalle-3 и последующих версий) заключаются в ее интуитивной понятности, отличном восприятии деталей в описаниях, способности добавлять текст непосредственно на графические работы, а также в минимальном риске возникновения искажений или ошибок при визуализации рук.
SVD (Stable Video Diffusion) - представляет собой инновационный подход к созданию видео на основе изображений с помощью искусственного интеллекта. Уникальность данной системы заключается в ее способности не только распознавать содержимое начального изображения, но и придавать изображенным объектам последовательные и осмысленные движения, что делает процесс создания видео более контролируемым и предсказуемым.
Мы рассмотрели тему: "термины в области искусственного интеллекта", если вам понравилась данная статья, то будем благодарны вашему лайку и комментарию)
Есть вопросы по нейросетям или по телеграм боту Yes Ai?
Пиши нам в техподдержку - Техподдержка Yes Ai
Подробнее о сервисе Yes Ai рассказываем в этом видео
Спасибо, теперь всегда есть где посмотреть, если что-то непонятно!)
Очень круто