GPT-4 выйдет на следующей неделе - и он будет мультимодальным. Microsoft Germany

"Мы представим GPT-4 на следующей неделе, у нас будут мультимодальные модели, которые будут предлагать совершенно разные возможности - например, видео" - технический директор Microsoft Germany Андреас Браун.

Андреас Браун, технический директор Microsoft Germany и руководитель подразделения Data & AI STU, вскользь упомянул о скором выходе GPT-4 на информационном мероприятии под названием "AI in Focus - Digital Kickoff".

CTO назвал LLM (Large Language Models) «переломным моментом в игре» благодаря тому, что он учит машины понимать естественный язык, что позволяет статистически интерпретировать то, что раньше было понятно только людям. По мере развития технологии она сможет эффективно «работать на всех языках»: вы можете задать запрос на немецком языке и получить ответ на итальянском. Мультимодальность OpenAI от Microsoft сделает модели более всеобъемлющими.

Перемены и дестабилизация

К Брауну присоединилась генеральный директор Microsoft Germany Марианна Яник, которая говорила о дестабилизации с помощью ИИ. Яник подчеркнула потенциал искусственного интеллекта в создании стоимости и говорила о переломном моменте времени - нынешнее развитие ИИ и ChatGPT - это "момент iPhone". По его словам, речь идет не о замене рабочих мест, а о выполнении повторяющихся задач по-другому, чем раньше.

Перемены не обязательно означают потерю рабочих мест. Потребуется "много специалистов, чтобы использование ИИ принесло пользу", - подчеркнула Яник. Традиционные должностные инструкции сейчас меняются, и в результате обогащения новыми возможностями появляются новые интересные профессии. Она рекомендует компаниям формировать внутренние "центры компетенций", которые могут обучать сотрудников использованию ИИ и объединять идеи для проектов. При этом "следует подумать о миграции старых добрых сотрудников".

Примеры использования, которые доступны уже сегодня

Клеменс Зибер (старший специалист по ИИ) и Хольгер Кенн (главный технолог по развитию бизнеса в области ИИ и новых технологий, оба - Microsoft Германия) рассказали о практическом применении ИИ и конкретных случаях использования, над которыми в настоящее время работают их команды, а также о технической базе. Кенн объяснил, что такое мультимодальный ИИ, который может переводить текст не только по изображениям, но и по музыке и видео, и рассказал об эмбеддингах, которые используются для внутреннего представления текста в модели, в дополнение к классу моделей GPT-3.5. По словам Кенна, ответственный ИИ уже встроен в продукты Microsoft, и "миллионы запросов могут быть отображены в API" через облако.

Клеменс Зиблер проиллюстрировал примерами использования то, что возможно уже сегодня. Например, можно записывать телефонные разговоры в формате "speech-to-text", что позволит агентам колл-центра не набирать вручную краткое содержание звонка. По словам Зиблера, это может сэкономить 500 рабочих часов в день для крупного клиента Microsoft в Нидерландах, который принимает 30 000 звонков в день. А прототип для проекта был создан за два часа, один разработчик реализовал проект за две недели (плюс дополнительное время на окончательную реализацию).

Отвечая на вопрос о надежности работы и достоверности фактов, Зиблер сказал, что ИИ не всегда будет отвечать правильно, поэтому необходимо проводить валидацию. В настоящее время Microsoft создает метрики достоверности для решения этой проблемы. Клиенты часто используют поддержку ИИ только на собственных наборах данных, в основном для понимания прочитанного и запроса данных инвентаризации, где модели уже достаточно точны. Однако текст, сгенерированный моделью, остается генеративным и поэтому не поддается легкой проверке. Мы строим вокруг него петлю обратной связи с "пальцами вверх" и "пальцами вниз", - сказал Зиблер, - это итеративный процесс". Интересно, что никто из четырех сотрудников Microsoft не прокомментировал интеграцию ИИ в собственную поисковую систему компании, "новый Bing". На заключительной панели не было возможности задать вопросы аудитории, и на нее были допущены только предварительно зарегистрированные участники.

0
44 комментария
Написать комментарий...
Вася Пражкин
Перемены не обязательно означают потерю рабочих мест.

Сейчас где-то джун-копирайтер, который еле-еле нашёл работу после полугода поисков и 53 собесов с тестовыми, где выебали и высушили:

Ответить
Развернуть ветку
Joe McEachern

Джун ещё не начался, возможно тогда ему станет легче.

Ответить
Развернуть ветку
Alex S.

Пусть переучивается на сантехника. Сантехников нескоро ИИ заменит

Ответить
Развернуть ветку
Невероятный Блондин
Весь контент на этом сайте создан при помощи Gerwin

Нехорошо врать.
GPT не допустил бы такой человеческой ошибки как «ться»

Поймал за руку, оправдывайтесь )))

Ответить
Развернуть ветку
Вася Пражкин
Ответить
Развернуть ветку
Невероятный Блондин

Да на таких как я мир держится
🌍
🐢

Иначе что было бы?
Правильно, хаос был бы!

Меня ценить надо, и лепестками роз путь устилать.

Ответить
Развернуть ветку
Вася Пражкин
Да на таких как я мир держится

Да ладно, мир держится на брюнетах:

Ответить
Развернуть ветку
Невероятный Блондин

Судя по оттенкам и переливам на прядях, он из наших.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Чайка О.

Может, он плохо обучен.
Например:
1) Займитесь наконец продажами — правильно: Займитесь, наконец, продажами
2) Gerwin прекрасно знает как продать ваш товар — правильно: Gerwin прекрасно знает, как продать ваш товар
3) не теряя драгоценное время — допустимо, но более грамотный вариант: не теряя драгоценного времени
4) написанием контента, писать контент и т.п. — синонимы слова "контент" — "информация", "содержимое", а в связке с "писать" подразумевается "текст".

Ответить
Развернуть ветку
Бинарный Ёж
Перемены не обязательно означают потерю рабочих мест.
По словам Зиблера, это может сэкономить 500 рабочих часов в день для крупного клиента Microsoft в Нидерландах.
Ответить
Развернуть ветку
Ado

Нет-нет, что вы, это лишь означает, что у спецов колл-центра появится 500 часов в день, чтобы смотреть сгененированных нейросетью котиков!

Сокращений не будет, твердо и четко🫡

Ответить
Развернуть ветку
Joe McEachern

Так наоборот повышение, столько времени нужно для котиков.

Ответить
Развернуть ветку
Wera Ferat

Кстати, я тоже обратила внимание на это несоответствие, посмотрим, сколько сократят рабочих мест к концу года.

Ответить
Развернуть ветку
Майнкрафтер Фирамир

GPT-3.5: сдаёт экзамены, пишет статьи на копирайтерские биржи
GPT-4: зачем-то интересуется, кто такая Сара Коннор

Ответить
Развернуть ветку
SS SS

Gtp 6.0 переименовывает себя в Skynet

Ответить
Развернуть ветку
Вадим Д.

Крутотень, дайте две!
Видео ладно, текст в речь пусть дадут хорошую и даром (-:

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
PriceLoom.com

Судя по темпам развития, скорее 4.5

Ответить
Развернуть ветку
Франсуа Пиньон

апдейт, который она сама же и напишет к лету)

Ответить
Развернуть ветку
Joe McEachern

Судя по таким высоким темпам развития, что уже 4.5?

Ответить
Развернуть ветку
Рама

Судя по темпам, 4.5 выйдет уже через 2 недели

Ответить
Развернуть ветку
Бинарный Ёж

гпт-6 будет проверять сочинения ЕГЭ
гпт-7 законодательно закрепят литературной нормой

Ответить
Развернуть ветку
Joe McEachern

уже захватили наш разум

Ответить
Развернуть ветку
Vasili Kubarev

Погодите-ка а как же гпт-1 от Роснано? Обещали же к 2030-му году.

Ответить
Развернуть ветку
Михаил Кометов

А мне нравится GPT 5. Огромная карта, 3 героя управляемых почти одновременно, крутая сюжетка

Ответить
Развернуть ветку
Сгенерированный Кот
можно записывать телефонные разговоры в формате "speech-to-text", что позволит агентам колл-центра не набирать вручную содержание звонка

Тот момент, когда думал, что такое уже давно есть, а оно только будет внедрено и рекламируется как "прорыв".
Можете, конечно, назвать меня душной мразью, но интернет я себе в настоящее время представлял как фильме "Джонни-мнемоник" - надел такие специальные очки, а там целый виртуальный мир. А не вот это всё - смотреть в квадратную штуковину.

Ответить
Развернуть ветку
Gogi Jan

Речь о сводке, а не стенограмме. Как раз для нейросети задачка

Ответить
Развернуть ветку
Paul Brie

Тоже не понял, чуть ли не в любом мессенджере можно распечатать голосовое же, или "субтитры на ходу" у стримингов.
Типа секретарь Олег вручную пишет стенограмму своего общениия с другими роботами уже года.. два, три?

Ответить
Развернуть ветку
Maxim Sinyak

Тут в памяти пример. Гугл переводчик мог text-to-speech уже кучу лет.
Но только нейронка text-to-speech может подделать голос Маска или Байдена.

Какие преимущества у AI speech-to-text перед программой speech-to-text — я не представляю себе. Может точнее всё это делает, быстрее, сложнее

Ответить
Развернуть ветку
Илларион

Может пересказать своими словами.
Короче, или подробнее, почти как кожаный мешок

Ответить
Развернуть ветку
Maxim Sinyak

Ну, пересказать своими словами может и сервис StT в связке с GPT

Ответить
Развернуть ветку
Андрей Фимин

Замечаю, что свежие нейронки гораздо качественнее разбирают голос. Они переваривают незначительные запинки и мычания. Будто смысл понимают, а не только голос. А прежние придумывали странные слова.

Ответить
Развернуть ветку
Владимир Воловцев

Мы живём в такое время, что нужно быстрее двигать мозгами и приспосабливаться к новым реалям рынка вакансий.

Ответить
Развернуть ветку
Денис

Скорее всего через пару лет появятся такие вакансии, которых сейчас еще нет.

Ответить
Развернуть ветку
Саша G

Они уже появились - Prompt engineer

Ответить
Развернуть ветку
Александр Морозов

Пром. инженер)

Ответить
Развернуть ветку
Your very own fear

Это точно. Всё-таки все эти нейросетки и т.д. — это просто инструменты, не более.

Ответить
Развернуть ветку
Spooky Surfer

Всё, теперь ждём миллион новых постов про gpt-4 и его отличия от gpt-3...

Ответить
Развернуть ветку
Alexandr Sosnovsky

Так gpt4 выходит или нет? Заголовок крутой, но фактов про чувака с Германии 😺

Ответить
Развернуть ветку
Kruason

Й

Ответить
Развернуть ветку
Андрей Кириллов

А можно теперь новость про девайс на заглавной картинке?

Ответить
Развернуть ветку
Hank Coffe

в предвкушении второй волны статей про нейросеть на вс

Ответить
Развернуть ветку
Sergey Degtyarik

Судя по нечитабельному тексту в статье, её написал GPT-1

Ответить
Развернуть ветку
41 комментарий
Раскрывать всегда