реклама
разместить

Исследование: человечество неправильно обучает ИИ — большинство моделей не работают в реальном мире

К такому выводу пришли 40 исследователей из Google. Почему за границами лабораторий модели машинного обучения не оправдывают себя — в конспекте материала MIT Technology Review.

Результаты стресс-теста 50 различных моделей машинного обучения при одинаковых условиях
Результаты стресс-теста 50 различных моделей машинного обучения при одинаковых условиях

Часто модели машинного обучения нежизнеспособны из-за того, что данные, на которых их обучали, не соответствуют с данными в реальности. К примеру, исследователи обучают ИИ распознавать признаки болезни по качественным медицинским снимкам, но в реальных клинических условиях они сделаны наскоро и дешёвой камерой.

Но это не единственная проблема. Группа из 40 исследователей из семи различных команд Google выявила ещё одну — недоспецификацию.

Представим типичный сценарий: сначала модель обучают на множестве примеров, после тестируют на новых данных — и спустя несколько этапов её можно применять на практике.

Однако исследователи считают, что способ слишком грубый. В таком обучении не учитываются:

  • Случайные значения, которые могла задать нейросеть ещё до начала обучения.
  • Способ выбора и демонстрации данных.
  • Количество тестов.

При одинаковых условиях можно создать разные модели — и все они будут немного отличаться, если не учесть детали. Эти незначительные, часто случайные различия игнорируются, но в реальности могут сильно влиять на итоговый результат. Поэтому невозможно предсказать, будет ли тестируемая модель жизнеспособна, думают исследователи Google.

И проблема не похожа на несоответствие обучающих данных с реальными. Недоспецификация — это когда даже при удачном тестировании модели в реальности ИИ может оказаться нерабочим.

Исследователи проверили гипотезу: они взяли несколько моделей и провели их через одинаковые процессы машинного обучения. После запустили несколько стресс-тестов, чтобы быстро проверить различия в производительности.

К примеру, они взяли 50 моделей и обучили их распознавать изображения. Для этого исследователи использовали базу данных ImageNet. Единственным отличием в моделях были случайные значения, присвоенные нейросети на старте.

В тестировании использовали ImageNet-C — набор картинок из ImageNet, но сжатых до нескольких пикселей и с изменёнными яркостью и контрастностью. Также взяли изображения ObjectNet — повседневные объекты под непривычными углами и со сложным фоном: перевёрнутые чайники и стулья, висящие на крючках футболки.

Часть моделей лучше распознавала пиксельные картинки, часть — предметы. В итоге они показали похожий результат, но с разной производительностью.

После сделали тесты по тому же принципу, но уже с медицинскими данными, результат тот же — модели, которые должны были быть одинаково точными, работали по-разному при тестировании с реальными данными.

Возможно, нам придётся пересмотреть то, как мы оцениваем нейронные сети.

Брэндон Рорер

Исследователи указывают, что нужно делать гораздо больше тестов, чтобы ИИ был жизнеспособнее в реальных условиях. Но это непросто: для текущего эксперимента в стресс-тестах использовали данные из реального мира или данные, имитирующие его. Это не всегда доступно.

Порой результаты противоречат друг другу: некоторые модели, которые хорошо распознавали пиксельные изображения, плохо распознавали контрастные изображения. Это показывает, что сложно обучить нейросеть, которая успешно пройдёт сразу несколько подобных тестов.

Что с этим делать

Одно из решений — разработать дополнительный этап обучения и тестирования, в котором параллельно выпускают сразу несколько моделей. Эти модели снова тестируют на реальных примерах, а после выбирают лучшую для конкретной задачи.

Но исследователь машинного обучения в ETH Zurich Янник Килчер говорит, что это слишком сложно для обычных исследователей и бизнеса — подобные разработки могут позволить себе корпорации вроде Google.

Автор исследования Алекс Д'Амур пока не понимает, как решить эту проблему, нужно изучить всё детальнее: «Часто мы только в самом конце узнаём, что требуется от модели обучения, когда она оказалась неудачной в реальном мире».

Сейчас мы слабо доверяем «убийственным приложениям». И мы хотим восстановить доверие.

Кэтрин Хеллер
1212
реклама
разместить
18 комментариев

Искусственный интеллект оценивается человеческим. Критерии оценки, надо полагать, тоже человеческие.

Но разве такой способ оценки в принципе может показать объективность? 😶

1

Ну да, пока ИИ не научился свои критерии формировать. 

Обычно лучшей моделью (в том числе на практике) является композиция всех этих тестируемых моделей. То есть мотивация "чтобы выбрать лучшую" - весьма спорна.

Описываемая "проблема" и предлагаемое решение с обучением нескольких моделей, это скорее ньюанс/трюк, про который знают и используют не только в гугле. Просто сравните с той же проблемой "недоспецификации" - ImageNet например, внезапно, это хороший датасет по классификации пород собак, и не очень хороший если вам нужна CV модель общего назначения. И тут уже действительно стоит упомянуть что только компании уровня фейсбука могут себе позволить предобучить резнет на миллиардах фото. А тестировать несколько моделей - норма жизни для любого адекватного data scientist.

2

как поможет ИИ , если большинство проблем медицины - это негативный государственный менеджмент ?

- быстрая массовая регулярная диагностика по крови отсутствует
- любой массовый скрининг населения на уровне Зимбабве или только для обеспеченных
- например если Клава в ресепшене тебя не пускает
- фарм индустрия понемногу травит народ чтоб было кого лечить

2

Название ИИ вводит людей в заблуждение. Многие думают, что компьютер что-то там придумывает. На самом деле ничего не придумывается, компьютер работает по созданному человеком алгоритму и не может его менять. Так, что к интеллекту это не имеет отношение. Обработать данные по заданному алгоритму, где здесь интеллект? Искусственного интеллекта не существует.

1
Раскрывать всегда
Я продала дом в Сибири и купила дом в Португалии за 5 млн ₽. Мёрзну, но не жалею

Я приехала в Португалию с маленьким чемоданчиком в отпуск, а осталась навсегда. Теперь у меня дома зимой +10°C, а летом я собираю апельсины в саду. В статье расскажу, как искала дом среди руин, как я открыла счёт в банке вопреки запретам, сколько я потратила на ремонт и сколько стоит жизнь в деревне из 22 человек.

Я продала дом в Сибири и купила дом в Португалии за 5 млн ₽. Мёрзну, но не жалею
120120
99
44
33
22
22
22
вот кстати выскажу мысль. на удивление война явно способствует разрастанию "русского мира", только конечно совсем другим способом. все самые способные, талантливые и просто с бОльшим средним IQ люди разъезжаются по миру, покупают дома, оседают, пьют вино с местными, заводят с ними потомство, расселяют и оздоравливают свои гены. к сожалению на родине при этом происходит противоположный процесс.
реклама
разместить
«Яндекс» запустил «Нейроэксперта» — сервис для работы с документами, презентациями и ссылками

Он создаст из загруженных материалов базу знаний и поможет найти в ней ответ на вопрос.

Источник фото: «Яндекс»
2727
66
22
С нетерпением ждём первое нейро-уголовное дело от товарища майора!
Manipuless: как я нашел решение личной проблемы и в итоге создал продукт, которым пользуются уже сотни людей

Приветствую всех! Сегодня я выпускаю в свет свой продукт, который когда-то сделал лично для себя, и который помог наконец решить одну из самых животрепещущих проблем моей жизни. Это тот самый случай, когда продукт стал популярен и востребован еще до маркетинга и первого вывода в свет.

Manipuless: как я нашел решение личной проблемы и в итоге создал продукт, которым пользуются уже сотни людей
«Глобальная тарифная война»: Дональд Трамп подписал указ о повышении пошлин на ввозимые в США товары — мировые лидеры предупредили об ответных мерах

Тарифы начнут действовать с 5 апреля 2025 года для 185 стран и территорий, за исключением России, Беларуси, Кубы и Северной Кореи.

Фото Reuters
2525
88
77
11
11
11
11
Американцы наверное будут рады заплатить за импортные товары на 10-70% больше
Продажи легковых автомобилей в марте 2025 года в России упали на 45% год к году — АЕБ

Накануне о результатах марта отчитался «АвтоВАЗ», назвав падение рынка «драматическим».

Источник: «АвтоВАЗ»
1212
Ура! Неужели потребители теперь думают головой
ФАС предложила установить сбор за возврат билетов на поезда в размере до 10% от их стоимости

Конкретный размер сбора будет устанавливать сам перевозчик.

Источник фото: РЖД / Telegram
88
22
Я хотел торговать овощами и фруктами, но в первый же месяц ушёл в минус на 350 000 рублей и чуть не попал ещё на 200 000

Практически задаром я распродавал свой товар, а когда понял, что точку мне не раскрутить, было уже поздно — моя история о том, как не надо делать бизнес.

В глубине фото мой отдел, но это уже арендаторы, которые были после меня
33
Китайскую Super Deer раскритиковали за «тюремные» порядки — сотрудников наказывали даже за неправильную расстановку стульев

За нарушение внутренних правил работников заставляли убираться в офисе.

Источник фото: Unsplash
1111
22
22
11
Хорошо что на западе такого нет! В Амазон там или в банковской сфере..
80 нейросетей, которые помогут тебе разобраться в теме и проанализируют десятки источников. Залил в одну табличку + краткое описание — эпичная подборка
80 нейросетей, которые помогут тебе разобраться в теме и проанализируют десятки источников. Залил в одну табличку + краткое описание — эпичная подборка
139139
66
44
44
Мне нужна нейросеть чтобы разобраться в подборке из 80 нейросетей