У многих застройщиков такие системы уже существуют несколько лет. Странная статья, так как опоздание с новизной лет на 5 уж точно.
В Москве в 2015 году, стажерам 4-го курса университета в GS платили, вроде бы, 3500$. PS: зарплата стажера = зарплате младшего аналитика
Дата-сеты (в AI) - это информация (выборка), записанная в табличном виде, которая была специально обработана и структурирована для последующего использования алгоритмами машинного обучения. Простыми словами - это правильно и внимательно заполненная таблица.
Супер простой пример:
Таблица умножения - является дата-сетом
Пример чуть сложнее:
Мы хотим построить регрессионную модель, которая покажет зависимость расхода топлива от разных параметров (цвет машины, мощность двигателя, размер машины, количество пассажиров и т д). Чтобы построить такую модель, данные нужно записать структурировано в таблицу, чтобы ПО смогло их принять и показать зависимости. Данная таблица может иметь следующий вид:
1 столбец - расход топлива;
2 столбец - мощность двигателя;
3 столбец - цвет машины;
и т. д.
Под каждым столбом должны быть записаны только нужные данные: под мощностью только лошадиные силы, под расходам топлива только литры и т д. Это и будет считаться дата-сетом.
Вы каждый раз пишите это и после этого ничего не происходит