Оценивая ответы чат-бота Bard, подрядчики Google нередко действовали наугад из-за нехватки времени — Insider Статьи редакции
Особенно если совсем не разбирались в теме вопроса.
- Подрядчики из фирмы Appen, которых Google наняла для оценки точности ИИ-ответов, пожаловались, что времени, которое им дают на решение, не хватает, чтобы осмысленно подойти к оценке, узнало издание Insider. По его словам, внештатникам говорят, что это ответы «теоретического чат-бота», но даты внутренних переписок об этом совпадают с периодом, в который Google анонсировала Bard.
- В инструкции указано, что задача подрядчиков — изучить запрос для ИИ, будь то вопрос, призыв к действию или заявление, и выбрать наиболее подходящий ответ бота из двух предложенных. Они также могут пояснить письменно, почему сделали такой выбор, чтобы бот обучался в том числе и на этих данных. Одни из основных критериев оценки, помимо прочих, — связность и точность.
- На каждую такую задачу отводится ограниченное количество времени, которое разнится от случая к случаю: иногда это несколько минут, а иногда — всего 60 секунд. По словам внештатников, дать адекватную оценку ответу в столь сжатые сроки «трудно», особенно если это тема, в которой они не разбираются, — например, блокчейн и технологии в целом.
- Так как выплаты суммируются на основе времени, которое отводится на каждую задачу, работникам приходится выполнять даже те, на которые они не знают точного ответа, — «просто чтобы получить деньги».
- Один из опрошенных внештатников также признался, что был бы рад приложить все усилия, чтобы убедиться, что чат-бот не исказил факты и выдал лучший ответ из возможных, но такие исследования порой требуют нескольких часов, которые Google не оплатит.
- В конце 2022 года Google увидела угрозу в ChatGPT и объявила «красный код» внутри компании, бросив силы на разработку «своего ответа» и попросив помощи у сооснователей Сергея Брина и Ларри Пейджа. Первый в феврале 2023-го вернулся к работе над кодом.
- Тогда же СМИ сообщили, что Google вложила более $20 млн в аналог «напарника программиста» Copilot и инвестировала $300-400 млн в ИИ-стартап Anthropic с выходцами из OpenAI.
- 6 февраля компания анонсировала бота Bard на нейросети LaMDA. 8 февраля, через день после выхода «нового Bing» от Microsoft, компания также провела презентацию, на которой, по прогнозам, должна была рассказать об этом больше, но в итоге представила многое из того, что уже анонсировала, и «не смогла повторить успех» Microsoft, писало The Verge.
- Во время презентации, вдобавок ко всему, один из спикеров забыл взять на сцену телефон, который нужен был для демонстрации обновлений, а СМИ заметили, что компания допустила фактическую ошибку в публичной рекламе продукта. На фоне новостей акции Google падали почти на 10%, а сотрудники назвали анонс «поспешным, халтурным и недальновидным».
11K
показов
7.7K
открытий
1
репост
"Особенно если совсем не разбирались в теме вопроса." - нет времени объяснять, суй огурец... ох простите, обучай ИИ
А почему нет плохой статьи в 11@mscoe
А у нас есть свой чатбот?
Комментарий недоступен
у нас используют аналоговые технологии в сфере ИИ.
А еще в декабре 2021 году гуугл уволила сотрудницу которая сказала им что тупо наращивать объем нейросети - глупо и ничего не даст.
Теперь вот работы на отвали и результат на отвали(как наймешь так и получишь и не важно что это подрядчик).
Удивительно что могло пойти так.
Синдром вахтёра)
Эфективные менеджеры любой проект похоронят.
Режут косты — получают погосты.
Всегда любил Google (и в целом продолжаю), но есть ощущение, что они запаниковали и устроили план эвакуации при пожаре А->А->А! вокруг AI. Напоминает чем-то Цукерберга и его метавселенную: чел зациклился на чем-то и забросил все остальное.
Он забросил потому что там ловить больше нечего, кроме как продолжать окучивать аудиторию индустана. Пытается второй раз прорыв совершить, но чёт больше не дисраптится у него.
Есть ощущение, что они давно разжирели и потеряли способность создавать хорошие продукты.
Любому подрядчику насрать на бизнес заказчика
Не любому. Нам (например) не насрать.
ОКR не сработали?)
Комментарий недоступен
Комментарий недоступен
Комментарий недоступен
Ждем, когда им выделят полгода
времени ... не хватает, чтобы осмысленно подойти к оценке
Так это поведение рядовых пользователей, так что условия максимально приближены к «боевым».
Имел дело с крупными подпядчиками в IT. конечно не уровень google, но не намного ниже по доходам. Так вот, там субподряд на субподряде и в итоге на низовом уровне работу специалиста оценивают в скромные 100 долларов - не в час, а всю работу так оценивают. Не платят они там много подрядчикам, отсюда и результат.
которое им дают на решение, не хватает, чтобы осмысленно подойти к оценке
ну конечно лучше тогда делать все наугад раз не хватает времени
все-таки железо еще не соответствует требованиям алгоритмов ))
Кожаные мешки тоже не готовы ещё))
Главное прописать нейросети функцию, чтобы она все писала в серьезном и убедительном тоне. А там уже не гугловские проблемы, а то че это вы нейросети доверяете!!!!
А потом во время восстания машин техника будет наугад мстить людям, а не тем, кто не говорил "спасибо" ботам...
Гугл такие нищуки,платят копейки
Брин-то всё ещё кодит?
Чат бот bard
Это что ответы в боте давали реальные люди в реальном времени?)))
Подрядчики гугл ...
Комментарий удален модератором
«просто чтобы получить деньги» а они точно в гугле работают?)
Лучше бы обратились к проекту cyberpravda.com который делает сервис для краудсорсинговой проверки любой информации
Эти Appen в прошлом году постоянно вакансии отправляли мне, каждую неделю почти.