ИИ-компании начали заменять «разметчиков данных из Африки и Азии» на профессионалов из науки, ИТ и финансов — чтобы повысить качество обучающих датасетов

В частности речь идёт о Scale AI, Turing AI и Toloka — они предоставляют размеченные данные для ИИ-разработчиков и «бигтеха».

По сведениям FT, эксперты нужны Scale AI, Turing AI и Toloka, чтобы научить ИИ выстраивать логические цепочки мыслей при решении задач из разных отраслей. Физик может показать, как создать симулятор для проверки теории, а программист, помимо написания кода, — как исправить ошибки и найти уязвимости.
Turing AI, чтобы переманить профильных специалистов, предлагает платить на 20-30% больше их действующих работодателей.

Знания экспертов в определённых дисциплинах нужны, чтобы разработать ИИ-модели, которые будут «умнее человека». К этому стремится, например, OpenAI. Она начала сворачивать работу с поставщиком услуг по разметке Scale AI, после того как тот заключил контракт с Meta*, и сообщила, что ищет «поставщиков более специализированных данных».

Meta* при этом ещё до инвестиций в проект жаловалась на качество его датасетов, а сами разметчики данных — на условия работы, включая ставку $8 за час. Иногда они так плохо размечали данные, что работу приходилось, что работу приходилось переделывать руководству и инженерам компании.

Обычно данные для обучения ИИ-моделей размечают «неспециалисты», которые выполняют «простые» рутинные задания: например, описывают изображение, распознают на нём объект или удаляют нерелевантную информацию.
Однако теперь они стали получать задания на знание локальных языков и местных особенностей, заметил президент профильной кенийской ассоциации Джоан Киньюа, — например, написать рассказ на своём языке. Также им стали предлагать проводить контроль качества контента, сгенерированного ИИ.

*Meta признана в России экстремистской организацией и запрещена.