Дата-сеты (в AI) - это информация (выборка), записанная в табличном виде, которая была специально обработана и структурирована для последующего использования алгоритмами машинного обучения. Простыми словами - это правильно и внимательно заполненная таблица.
Супер простой пример: Таблица умножения - является дата-сетом
Пример чуть сложнее: Мы хотим построить регрессионную модель, которая покажет зависимость расхода топлива от разных параметров (цвет машины, мощность двигателя, размер машины, количество пассажиров и т д). Чтобы построить такую модель, данные нужно записать структурировано в таблицу, чтобы ПО смогло их принять и показать зависимости. Данная таблица может иметь следующий вид: 1 столбец - расход топлива; 2 столбец - мощность двигателя; 3 столбец - цвет машины; и т. д. Под каждым столбом должны быть записаны только нужные данные: под мощностью только лошадиные силы, под расходам топлива только литры и т д. Это и будет считаться дата-сетом.
Дата-сеты (в AI) - это информация (выборка), записанная в табличном виде, которая была специально обработана и структурирована для последующего использования алгоритмами машинного обучения. Простыми словами - это правильно и внимательно заполненная таблица.
Супер простой пример:
Таблица умножения - является дата-сетом
Пример чуть сложнее:
Мы хотим построить регрессионную модель, которая покажет зависимость расхода топлива от разных параметров (цвет машины, мощность двигателя, размер машины, количество пассажиров и т д). Чтобы построить такую модель, данные нужно записать структурировано в таблицу, чтобы ПО смогло их принять и показать зависимости. Данная таблица может иметь следующий вид:
1 столбец - расход топлива;
2 столбец - мощность двигателя;
3 столбец - цвет машины;
и т. д.
Под каждым столбом должны быть записаны только нужные данные: под мощностью только лошадиные силы, под расходам топлива только литры и т д. Это и будет считаться дата-сетом.