Scribe v2 от 11Labs: распознавание речи с высокой точностью и скоростью
А вот еще кое-что от 11Labs.
Распознавлка речи, которая печатает текст почти раньше, чем вы договорили
Scribe v2 Realtime явно попытка перезадать стандарт рынка. Задержка до 150 мс, предиктивная транскрипция, когда фразы появляются на экране как будто с отрицательной задержкой, и точность до 93.5% на реальных шумных записях на десятках языков, включая русский.
Модель уверенно держит акценты, диалекты, сложные фамилии и профлексику из медицины, финансов и теха, язык можно переключать прямо в живом разговоре, движок сам подстраивается под контекст.
В бенчмарках и полевых тестах Scribe v2 обходит Гугл и ОпенАИ по сочетанию скорости и качества, а из минусов остаются разве что редкие микрокоррекции текста в очень сложных мультиспикерных сценах.
Подписывайтесь на Telegram Точки над ИИ.