Генеральный директор OpenAI Сэм Альтман: “нехватка вычислительных мощностей задерживает продукты компании»

Генеральный директор OpenAI Сэм Альтман: “нехватка вычислительных мощностей задерживает продукты компании»

В Reddit AMA генеральный директор OpenAI Сэм Альтман признал, что отсутствие вычислительной мощности является одним из основных факторов, препятствующих анонсам продуктов так часто, как ей хотелось бы.

"Все эти модели стали довольно сложными", - написал он в ответ на вопрос о том, почему следующие модели искусственного интеллекта OpenAI занимают так много времени. «Мы также сталкиваемся со многими ограничениями и трудными решениями о том, как мы распределили наши вычисления на многие замечательные идеи».

Многие отчеты свидетельствуют о том, что OpenAI изо всех сил пыталась обеспечить достаточную вычислительную инфраструктуру для запуска и обучения своих генеративных моделей. Только на этой неделе Reuters со ссылкой на источники сказал, что OpenAI уже несколько месяцев работает с Broadcom над созданием чипа искусственного интеллекта для запуска моделей, который может появиться уже в 2026 году.

Сгенерировано в <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fkolersky.com%2F&postId=1629511" rel="nofollow noreferrer noopener" target="_blank">KolerskyAI</a> “GPU”
Сгенерировано в KolerskyAI “GPU”

Отчасти из-за напряженной емкости, сказал Альтман, реалистично звучащая разговорная функция OpenAI для ChatGPT, расширенный голосовой режим, не получит возможности зрения, впервые дразнимые в апреле в ближайшее время. На апрельском пресс-мероприятии OpenAI показал приложение ChatGPT, работающее на смартфоне и реагирующее на визуальные сигналы, такие как одежда, которую кто-то носил, в поле зрения камеры телефона.

Отчеты из Fortune позже показали, что демо-версия была поспешно отвлечь внимание от конференции разработчиков Google I/O, которая прошла на той же неделе. Многие в OpenAI не думали, что GPT-4o готов к раскрытию. Показательно, что голосовая версия Advanced Voice Mode была отложена на несколько месяцев.

В AMA Альтман указал, что следующий крупный выпуск генератора изображений OpenAI, DALL-E, не имеет сроков запуска. («У нас еще нет плана выпуска», — сказал он.) Между тем, Sora, инструмент для создания видео OpenAI, был задержан «необходимостью совершенствовать модель, правильно обеспечить безопасность/олицетворение/другие вещи и масштабировать вычисления», - написал Кевин Вейл, директор по продуктам OpenAI, который также участвовал в AMA.

Сообщается, что Sora пострадала от технических неудач, которые плохо позиционируют ее против конкурирующих систем от Luma, Runway и других. Согласно The Information, первоначальная система, представленная в феврале, заняла более 10 минут времени обработки, чтобы сделать 1-минутный видеоклип.

В октябре один из соруководиков Sora, Тим Брукс, ушел в Google.

Позже в AMA Альтман сказал, что OpenAI все еще рассматривает возможность разрешить контент "NSFW" в ChatGPT "когда-нибудь" ("мы полностью верим в то, что взрослые пользователи относятся к взрослым", - написал он, и что главным приоритетом компании является улучшение ее серии моделей "рассуждений" и их преемников. OpenAI представил ряд функций, которые выходят на o1 на конференции DevDay в Лондоне на этой неделе, включая понимание изображений.

"У нас есть несколько очень хороших релизов, которые будут в конце этого года", - написал Альтман. «Ничто из этого мы не будем называть GPT-5».

Комментируйте статью!

Начать дискуссию