IMAX расширяет охват оригинального контента с помощью ИИ

IMAX расширяет охват оригинального контента с помощью ИИ

Привет! На связи Шерпа Роботикс, вендор платформ для роботизации бизнес-процессов. Сегодня мы перевели для вас статью, посвященную использованию ИИ для привлечения большей аудитории на примере IMAX.

В условиях растущего потребления контента во всем мире и спроса на локализованный контент, превосходящего спрос на англоязычные фильмы и сериалы, IMAX использует искусственный интеллект, чтобы масштабировать локализацию своих оригинальных продуктов.

По данным отчета PwC, объем рынка развлечений и медиа в 2023 году вырос на 5% и составил 2,8 трлн долларов. Ожидается, что отрасль продолжит расширяться, хотя и умеренными темпами — в среднем около 4% в год — до 3,4 трлн долларов в течение следующих пяти лет. Контент не на английском языке быстро растет даже на англоязычных рынках, включая США, Великобританию, Австралию и Канаду. В прошлом году Netflix сообщила о 90-процентном росте просмотров контента не на английском языке в Великобритании за последние три года. IMAX учла все эти факторы и теперь изучает возможности локализации с использованием ИИ для привлечения большей аудитории. В понедельник эта канадская медиа-компания, известная своими огромными кинотеатрами и захватывающими впечатлениями от просмотра фильмов, объявила о партнерстве с дубайским стартапом Camb.ai, планируя использовать его языковые ИИ-модели для перевода оригинального контента, включая документальные фильмы.

Camb.ai, которая уже внедрила собственную технологию дублирования и перевода речи на основе ИИ для прямых трансляций спортивных событий и лиг, включая Открытый чемпионат Австралии, Eurovision Sport и Major League Soccer, предлагает модель Boli для перевода речи в текст и модель Mars для имитации речи. Модели доступны через платформу DubStudio, которая поддерживает 140 языков, включая редкие языки, для которых в интернете нет значительного количества данных.

«У таких компаний, как OpenAI и Anthropic, иное видение общества», — сказал Акшат Пракаш, соучредитель и технический директор Camb.ai, в эксклюзивном интервью. — Они пытаются создавать модели, которые очень универсальны и могут охватывать широкий спектр задач… У нас же совсем другая цель. Некоторые из наших моделей имеют менее 100 миллионов параметров и являются сверхспециализированными».

Пракаш, бывший инженер Apple, работавший с командой разработчиков ИИ и машинного обучения для Siri, основал Camb.ai вместе со своим отцом Авнеешем Пракашем в прошлом году. «Мы из разных поколений, выросли в Индии. Тридцать лет разницы, и мы столкнулись с одними и теми же языковыми проблемами», — рассказал Пракаш в интервью TechCrunch.

Он сказал, что компания Camb.ai подготовила 70% своих моделей, используя наборы данных с академическими лицензиями, которые могут использоваться в коммерческих целях. Оставшиеся 30% для донастройки данных она получает от ранних партнеров, которые используют модели для дублирования и перевода на основе ИИ. «Чего мы не делаем, и мы очень осторожны и полностью избегаем этого, — так это потенциальный сбор данных из интернета, — утверждает Пракаш. — Некоторые компании считают, что могут избежать ответственности, потому что они создают важное приложение или инструмент для потребителей, и для этого можно спокойно собрать, например, 10 петабайт данных из интернета».

Camb.ai использует трехслойный подход для обеспечения перевода на основе ИИ, включающий базовый слой моделей Boli и Mars, инфраструктурный слой, на котором размещаются эти модели ИИ, и платформу DubStudio для интерфейса. В отличие от других моделей на основе ИИ, Boli от Camb.ai принимает входные речевые токены, выдает выходные текстовые токены на переведенном языке и сохраняет нюансы, утверждает Пракаш. После того как Boli генерирует текст, Mars переводит текст в речь, используя тот же входной аудиосигнал, чтобы захватить характеристики исходного аудио, включая окружающий звук, например, фоновую музыку или аплодисменты зрителей на спортивных мероприятиях, сказал он.

Пракаш заявил TechCrunch, что технология Camb.ai обеспечивает перевод речи на 10 языков одновременно с задержкой от 20 до 30 секунд, которую можно компенсировать задержкой потоковой передачи и вещания от 30 до 40 секунд.

IMAX будет поэтапно внедрять ИИ-перевод, начиная с самых распространенных языков. Внедрение произойдет после внутреннего тестирования технологии Camb.ai на оригинальном контенте IMAX. «Хотя мы находимся лишь на начальном этапе партнерства, мы будем продолжать работать вместе, чтобы лучше изучить потенциал и перспективы развития этих технологий», — сказал Марк Уэлтон, президент IMAX Global. Уэлтон подчеркнул, не раскрывая финансовых подробностей, что внедрение ИИ поможет сэкономить на затратах на перевод.

В настоящее время в Camb.ai работает команда из 50 человек. В феврале компания привлекла 4 миллиона долларов в рамках посевного раунда, возглавленного Courtside Ventures. Пракаш сообщил TechCrunch, что стартап завершает более крупный раунд финансирования до серии А для расширения своего охвата и увеличения численности персонала.

66
55
13 комментариев

Какие следующие продукты будут вы ходить?

Ну не знаю мне кажется живой человек лучше справится с переводом чем искуственный интелект особенно это касается перевода фильмов.

Как вы считаете, внедрение ИИ-перевода повлияет на традиционные подходы к переводу в кино и других областях? Означает ли это, что переводчики будут отстранены от процесса?

Наверно действительно на англоязычные фильмы и сериалы целесообразно прибегнуть к применению технологий искусственного интеллекта.

Мне кажется, что живой переводчик способен гораздо лучше выполнить перевод, чем искусственный интеллект, особенно когда речь заходит о фильмах. Как вы думаете, сможет ли внедрение ИИ в переводе изменить традиционные методы работы в кино и других сферах? Это означает, что переводчики могут быть исключены из процесса?