Объясните терминологию машинного обучения так, чтобы поняла ваша бабуля

Обновлено: в конкурсе от AI Russia выбрали шесть человек, которые доходчиво объяснили термины машинного обучения.

Объясните терминологию машинного обучения так, чтобы поняла ваша бабуля
1818

Дата-сеты (в AI) - это информация (выборка), записанная в табличном виде, которая была специально обработана и структурирована для последующего использования алгоритмами машинного обучения. Простыми словами - это правильно и внимательно заполненная таблица.


Супер простой пример:
Таблица умножения - является дата-сетом


Пример чуть сложнее:
Мы хотим построить регрессионную модель, которая покажет зависимость расхода топлива от разных параметров (цвет машины, мощность двигателя, размер машины, количество пассажиров и т д). Чтобы построить такую модель, данные нужно записать структурировано в таблицу, чтобы ПО смогло их принять и показать зависимости. Данная таблица может иметь следующий вид:
1 столбец - расход топлива;
2 столбец - мощность двигателя;
3 столбец - цвет машины;
и т. д.
Под каждым столбом должны быть записаны только нужные данные: под мощностью только лошадиные силы, под расходам топлива только литры и т д. Это и будет считаться дата-сетом.

Ответить