Объясните терминологию машинного обучения так, чтобы поняла ваша бабуля

Обновлено: в конкурсе от AI Russia выбрали шесть человек, которые доходчиво объяснили термины машинного обучения.

Объясните терминологию машинного обучения так, чтобы поняла ваша бабуля
1818

Датасет - набор данных (большая таблица), используемый для обучения нейросети и ее работы. Давайте представим, что нейросеть - это специальное устройство, адаптивный фильтр, который пропускает через себя информацию, фильтруя и преобразуя ее и попутно изменяя свою внутреннюю логику. Тогда датасет - это:
1) первоначальная (сырая) информация, которую мы подаем на вход нейросети. Можно сказать, что это ее еда, переварив которую, нейросеть выдаст что то полезное (или не очень 😉)
2) иногда к первому пункту добавляется вторая часть - подсказка для сети какой информации на входе должна соответствовать какая информация на выходе. Т.е. мы ей говорим: вот тебе картинка (т. е. табличка, числа в которой говорят в каком месте какого цвета точку нарисовать) - это вход, вот тебе ответ: "котик" - это выход (или ответ). Теперь ты должна стремится изменить свою внутреннюю логику так, что когда мы дадим тебе следующую похожую картинку - ты должна выдать нам ответ "котик".