Говорим на языке ИИ: словарь базовых терминов
30 ключевых понятий из мира AI, ML и подготовки данных. Подойдёт для специалистов, менеджеров, студентов и всех, кто участвует в создании и применении AI-решений. Словарь структурирован по разделам: от основ ИИ до работы с данными и построения моделей.
1. Общие термины в AI/ML
Искусственный интеллект (Artificial Intelligence, AI) — область компьютерных наук, которая стремится наделить машины способностью к интеллектуальному поведению. Это включает в себя понимание, рассуждение, обучение и адаптацию к новым данным.
Машинное обучение (Machine Learning, ML) — подраздел искусственного интеллекта, занимающийся разработкой алгоритмов, которые автоматически улучшают свои предсказания или действия на основе накопленного опыта. Вместо того чтобы явно программировать каждое правило, ML-модели обучаются находить зависимости в данных и использовать их для принятия решений или прогнозов.
Глубокое обучение (Deep Learning) — подобласть искусственного интеллекта и машинного обучения, в которой используются нейронные сети с несколькими «скрытыми» (глубокими) слоями. Благодаря как алгоритмическим улучшениям, так и технологическим достижениям, в последние годы глубокое обучение успешно используется для обучения моделей ИИ, которые могут выполнять множество сложных задач, подобных человеческим, — от распознавания речи до идентификации содержимого изображения.
Большие данные (Big Data) — наборы данных, объём и сложность которых превышают возможности традиционных методов обработки. Big Data лежат в основе аналитики поведения пользователей, рекомендательных систем, мониторинга систем и предиктивных моделей.
Компьютерное зрение (Computer Vision) — подобласть компьютерных наук, искусственного интеллекта и машинного обучения, которая стремится дать компьютерам быстрое и высокоуровневое понимание изображений и видео, «видя» их так же, как люди. В последние годы компьютерное зрение добилось больших успехов в точности и скорости благодаря глубокому обучению и нейронным сетям.
Обработка естественного языка (Natural Language Processing, NLP) — подобласть искусственного интеллекта, посвящённая анализу, пониманию и генерации текста на человеческих языках. NLP объединяет лингвистику, машинное обучение и статистику для решения таких задач, как автоматический перевод, извлечение информации, чат-боты, классификация тональности, генерация текста и распознавание речи.
Генеративный ИИ (Generative AI) — направление искусственного интеллекта, сосредоточенное на создании новых данных на основе обученной модели. Такие системы могут генерировать тексты, изображения, музыку, видео и даже программный код. Генеративный ИИ основан на архитектурах вроде трансформеров, GAN или диффузионных моделей. Он активно применяется в креативных индустриях, автоматизации контента, дизайне и общении с пользователями — например, в виде ChatGPT, Midjourney или GitHub Copilot.
Большая языковая модель (Large Language Model, LLM) — тип нейросетевой архитектуры, обученной на огромных объёмах текстовых данных для решения задач, связанных с языком: генерация, перевод, обобщение, классификация, извлечение информации и др. LLM опираются на трансформеры (например, GPT, BERT) и способны обрабатывать сложные запросы, поддерживать диалог и адаптироваться к контексту. Являются основой современных чат-ботов и AI-ассистентов.
Модель мультимодального понимания (Vision-Language Model, VLM) — архитектура, объединяющая обработку визуальной информации (изображений или видео) и естественного языка. Такие модели позволяют, например, описывать изображения, отвечать на вопросы о них, находить объекты по текстовому описанию. Основаны на объединении CNN/ViT и LLM и находят применение в медицинской диагностике, автономных системах и генерации изображений по тексту.
2. Обучение моделей
Модель ИИ (Model) — результат обучения алгоритма ИИ с учетом входных данных и настроек (известных как «гиперпараметры»). Модель ИИ — это очищенное представление, которое пытается инкапсулировать всё, чему алгоритм ИИ научился в процессе обучения. Модели можно совместно использовать и повторно применять на новых данных в реальных условиях.
Предварительно обученная модель (Pretrained Model) — модель ИИ, которая уже была обучена на наборе входных обучающих данных. При наличии входных данных предварительно обученная модель может быстро вернуть свой прогноз без необходимости повторного обучения. Такие модели также можно использовать для трансферного обучения — переноса знаний на другую, но похожую задачу (например, от распознавания производителей автомобилей к производителям грузовиков).
Обучение ИИ (Training) — итеративный процесс, в ходе которого модель ИИ получает входные данные, делает предсказания, сравнивает их с ожидаемыми результатами и корректирует свои внутренние параметры для повышения точности. Этот процесс продолжается до тех пор, пока модель не достигнет приемлемого уровня производительности на заданной задаче.
Обучение с учителем (Supervised Learning) — тип машинного обучения, при котором алгоритм обучается на размеченных данных, то есть каждый пример входных данных сопровождается правильным ответом (меткой). Модель учится находить закономерности и сопоставлять входы с соответствующими выходами, чтобы затем делать предсказания на новых данных.
Обучение без учителя (Unsupervised Learning) — метод машинного обучения, в котором алгоритм работает с неразмеченными данными, без заранее заданных меток. Цель такого подхода — выявить скрытые структуры, группы или закономерности в данных, например, сегментировать пользователей по поведению или находить аномалии.
Обучение с подкреплением (Reinforcement Learning) — подход, при котором агент взаимодействует с окружающей средой, выполняет действия и получает за них вознаграждение или наказание. Цель агента — максимизировать общую награду, постепенно обучаясь оптимальной стратегии поведения. Метод широко применяется в робототехнике, управлении и играх.
Донастройка (Fine-tuning) — процесс дополнительного обучения предварительно обученной модели на более узком наборе данных или конкретной задаче. Это позволяет адаптировать обобщённые знания модели под специфику новой области, повысив точность и релевантность при меньших затратах на ресурсы и данные.
Ансамблевое обучение (Ensemble Learning) — метод машинного обучения, при котором несколько различных моделей объединяются для принятия более точных и надёжных решений. Вместо одной модели используется ансамбль, где результаты могут агрегироваться через голосование, усреднение или взвешенные схемы. Это повышает устойчивость к ошибкам отдельных моделей и часто даёт лучшие результаты, чем использование одной модели.
Генеративно-состязательная сеть (Generative Adversarial Network, GAN) — архитектура нейронных сетей, состоящая из двух компонентов: генератора, создающего синтетические данные (например, изображения), и дискриминатора, пытающегося отличить их от реальных. Обе сети обучаются в противостоянии, что позволяет генератору создавать всё более правдоподобные данные. GAN активно используется в генерации изображений, стилизации и deepfake-технологиях.
Нейронная сеть (Neural Network) — математическая модель, вдохновлённая биологическим мозгом. Состоит из слоёв искусственных нейронов, каждый из которых принимает входы, обрабатывает их и передаёт результат далее. Такие сети способны обучаться сложным зависимостям в данных и являются основой большинства современных AI-систем, включая компьютерное зрение, обработку текста и генерацию контента.
Человек в контуре (Human-in-the-Loop, HITL) — метод взаимодействия между человеком и ИИ, при котором человек активно участвует в обучении, проверке или корректировке модели. Такой подход используется для повышения точности, предотвращения ошибок и обеспечения соответствия модели реальным требованиям. Особенно полезен в критичных областях — например, медицине, юриспруденции или автоматизации принятия решений.
Обучение с подкреплением с обратной связью от человека (Reinforcement Learning with Human Feedback, RLHF) — разновидность обучения с подкреплением, в которой сигнал награды формируется на основе человеческой оценки. Это позволяет обучать модели не только достигать формальных целей, но и учитывать субъективные предпочтения, моральные нормы и другие трудно формализуемые критерии. RLHF используется, например, для дообучения больших языковых моделей.
Активное обучение (Active Learning) — стратегия, при которой модель ИИ активно выбирает те примеры, в предсказаниях по которым она наименее уверена, и запрашивает их аннотирование человеком. Это позволяет сократить объёмы ручной разметки, сосредоточив усилия на данных, которые действительно важны для улучшения качества модели. Метод часто применяется в случаях, когда получение размеченных данных дорого или требует экспертной оценки.
3. Подготовка данных
Аннотация (Annotation) — процесс добавления меток или разметки к необработанным данным для использования в обучении моделей ИИ. В задачах компьютерного зрения это может быть выделение объектов с помощью ограничивающих рамок (bounding boxes), масок сегментации или ключевых точек. В обработке текста — разметка сущностей, отношений, намерений. Аннотация является критически важной основой для обучения моделей с учителем.
Оптическое распознавание символов (Optical Character Recognition, OCR) — технология, позволяющая извлекать печатный или рукописный текст с изображений или сканированных документов и преобразовывать его в машиночитаемый цифровой формат. OCR широко используется в автоматизации ввода данных, цифровых архивах, документообороте и распознавании чеков или счетов.
Аугментации (Image Augmentation) — техника увеличения объёма и разнообразия обучающего датасета путём внесения случайных или систематических изменений в изображения. Примеры таких трансформаций: поворот, отражение, масштабирование, обрезка, изменение яркости или наложение шума. Аугментации помогают модели лучше обобщать и предотвращают переобучение.
Синтетические данные (Synthetic Data) — искусственно созданные данные, имитирующие реальные, но сгенерированные с помощью алгоритмов или симуляций. Это могут быть 3D-рендеры, данные из движков физического моделирования или генеративные модели (например, GAN). Синтетика используется, когда доступ к реальным данным ограничен, их получение дорого или они подлежат защите конфиденциальности.
Эталонные данные (Ground Truth) — достоверные, проверенные вручную данные, которые считаются объективно правильными и используются в качестве ориентира при обучении и валидации моделей. Эталонные данные часто создаются с участием экспертов или через консенсусную аннотацию. Они служат основой для расчёта метрик качества и калибровки алгоритмов машинного обучения.
Сбор данных (Data Collection) — процесс получения, извлечения и накопления данных из разнообразных источников, таких как датчики, камеры, открытые базы, API или ручной ввод. Качественный сбор данных — фундамент успешной AI-системы. Он требует учёта репрезентативности, объёма, разнообразия и актуальности информации.
Контроль качества (Quality Control) — совокупность процессов и методик, направленных на проверку точности, полноты и согласованности аннотаций или данных. QC может включать выборочную проверку, двойную разметку, проверку с помощью валидаторов и автоматические метрики. Эффективный контроль качества критически важен для обеспечения надёжности моделей, обучаемых на этих данных.
Консенсусная аннотация / Голосование большинством (Consensus Annotation / Majority Voting) — метод проверки или финализации аннотации, при котором несколько аннотаторов размечают один и тот же объект. Окончательная метка определяется на основе согласия (консенсуса) или большинства голосов. Это повышает надёжность разметки и минимизирует влияние субъективных ошибок.
Мы не пытались охватить весь словарь индустрии, а собрали только то, что действительно встречается в проектах. Добавили бы что-то своё? Поделитесь в комментариях — словарь живой.