{"id":14277,"url":"\/distributions\/14277\/click?bit=1&hash=17ce698c744183890278e5e72fb5473eaa8dd0a28fac1d357bd91d8537b18c22","title":"\u041e\u0446\u0438\u0444\u0440\u043e\u0432\u0430\u0442\u044c \u043b\u0438\u0442\u0440\u044b \u0431\u0435\u043d\u0437\u0438\u043d\u0430 \u0438\u043b\u0438 \u0437\u043e\u043b\u043e\u0442\u044b\u0435 \u0443\u043a\u0440\u0430\u0448\u0435\u043d\u0438\u044f","buttonText":"\u041a\u0430\u043a?","imageUuid":"771ad34a-9f50-5b0b-bc84-204d36a20025"}

Как израильский стартап создает субтитры для Udacity

Как СЕО AI-компании Verbit, которая занимается транскрибированием аудио- и видеозаписей и созданием субтитров — делюсь опытом сотрудничества с одной из лидирующих образовательных платформ в мире.

По данным исследования Global MOOCs Market 2018-2022, среднегодовой темп роста рынка онлайн-образования составит 30% за период 2018-2022 годов. Всё больше людей выбирают онлайн-курсы как возможность получить новую профессию или повысить квалификацию.

Образовательным платформам необходимо создавать субтитры к видеолекциям как можно быстрее и при этом обеспечить высокую точность текстов. Онлайн-провайдеры ищут оптимальные способы транскрибирования, способные снизить расходы. Одна из таких платформ, Udacity, стала клиентом нашей компании Verbit, создавшей высокоточную ИИ-технологию транскрибирования. Рассмотрим цели и результаты сотрудничества.

Как работают MOOC-платформы — на примере Udacity

Платформы, которые размещают у себя онлайн-курсы и дают к ним доступ аудитории, называют термином MOOC (massive open online course). Самые известные примеры таких проектов — Coursera, Udacity, edX, Khan Academy.

Большинство MOOC-платформ работает по модели freemium — базовый функционал предоставляется бесплатно, а за дополнительные опции — за деньги. Платными могут быть отдельные курсы, сертификаты и дипломы, «ручная» проверка домашних заданий, общение с лекторами и кураторами. При такой модели компаниям нужно повышать скорость и снижать затраты на производство, не теряя в качестве. Именно такую задачу мы решали вместе с Udacity.

Udacity — это провайдер онлайн-образования, созданный в 2012 году. Кофаундер Udacity — бывший профессор Стэнфордского университета Себастьян Трун, эксперт в области робототехники, участвовавший в создании Google X и разработке беспилотных автомобилей.

Udacity совместно с профильными компаниями (от Kaggle и Google до Mercedes) разрабатывает и предоставляет бесплатные курсы, которые учат программировать, разбираться в VR, data science и диджитал-маркетинге, запускать стартапы. В фокусе — бизнес и технологии.

В 2014 году Udacity столкнулась с тем, что курсы заканчивает только 10% записавшихся студентов. Чтобы их удержать, компания запустила «нанодипломы» по востребованным на рынке направлениям. Сейчас их пять — Data Science, AI, программирование, бизнес и самоуправляемые (автономные) системы. Программы nanodegree платные, но дипломы при устройстве на работу принимают гиганты рынка, включая Google и Cloudera.

Курсы Udacity — англоязычные. Они разделены на видеоуроки с субтитрами, к каждой лекции прилагается задание, которое может проверить преподаватель. Успешно прошедший курс студент по итогам финального тестирования получает онлайн-сертификат. Сейчас на платформе более 10 млн учеников из 190 стран мира. Компания заявляет, что ее основной приоритет — успех студентов.

Почему онлайн-курсам нужно ИИ-транскрибирование

В случае Udacity главными требованиями к подготовке субтитров были точность, масштабируемость и скорость подготовки. Платформе нужно, чтобы курсы были доступны максимально широкой аудитории, включая людей, которые не являются носителями английского языка, плохо воспринимают аудио или испытывают проблемы со слухом. А значит, точность и корректность субтитров — на первом месте.

Так как на платформе каждую неделю появляется более 20 часов новых видеоуроков, для которых нужны субтитры, Udacity также важна скорость транскрибирования.

Платформа работает с миллионами студентов по всему миру, поэтому курсы Udacity должны отвечать высоким стандартам качества и быть доступными на различных носителях. В компании стремились минимизировать затраты на транскрибирование видео и при этом обеспечить точность субтитров и удобство их чтения.

О решении, предоставляемом Verbit, узнала Кимберли Драйден, бывшая тогда главой видеодепартамента Udacity. Сначала Драйден отнеслась к платформе скептически — она раньше сталкивалась с машинным транскрибированием, и результаты не впечатляли. Однако компании нужен был новый провайдер субтитров — качество работы предыдущего оставляло желать лучшего. Поэтому Драйден решила рискнуть.

Машинная расшифровка в онлайн-образовании

В 2016 году мы запустили Verbit, чтобы упростить процесс транскрибирования и подготовки субтитров. У компании есть офисы в трех странах — Израиле (Тель-Авив), США (Нью-Йорк) и Украине (Киев). В киевском отделении работают специалисты по машинному обучению, которые ответственны за развитие нейросети, а также программисты, HR и тестировщик.

В решении мы комбинируем возможности машинного и человеческого интеллекта, так как полностью автоматизированное транскрибирование пока дает не более чем 90% точность.

Для перевода аудио- и видеоматериалов в текст мы используем нейросеть, которая постоянно обучается. Упрощенно работу deep learning алгоритмов можно представить так: нейросеть получает аудиозапись, разделяет ее на маленькие фрагменты и «переводит» их в буквы, которые затем старается составить в слова и словосочетания. Соответствий может быть много. Машина выбирает самые вероятные буквенные комбинации, основываясь на своем «словарном запасе». Допустим, если она слышит слово «образов(?)ние», вариантов может быть несколько. Например, «образование» или «образовение». Первый вариант более вероятен, поэтому алгоритм предпочтет его.

Наша нейросеть натренирована различать специфические термины, которые встречаются в онлайн-курсах. Но не всегда ИИ делает правильный выбор. Чтобы избежать ошибок, результаты работы нейросети проверяют профессиональные корректоры, с которыми мы сотрудничаем. Таким образом нам удается добиться 99% точности.

Работая с командой Udacity, мы интегрировали платформу Verbit в их CMS, чтобы специалисты по контенту могли получать субтитры в один клик.

Среди требований Udacity была не только точность, но и сжатые сроки выполнения транскрибирования — не более 5 рабочих дней для каждого курса. Сочетая подходы, мы справляемся с этими задачами в три раза быстрее, чем ожидалось. Затраты платформы на подготовку субтитров снизились на 20%. Компания отметила, что вместе мы смогли сохранить ее ключевые ценности — приоритет студентов и доступность высшего образования для всех.

Субтитры или транскрибирование аудиозаписей нужны не только в образовательной сфере. Технологию можно использовать в маркетинге, юриспруденции, страховании и медицине.

0
Комментарии
-3 комментариев
Раскрывать всегда