Ну что, уже успели прочитать восхищения небывалым качеством видео от нейросетки SORA у всех блогеров и новостных изданий? А теперь мы вам расскажем то, о чем не написал никто: чего на самом деле пытается добиться OpenAI с помощью этой модели, как связана генерация видео с самоездящими машинами и AGI, а также при чем здесь культовая «Матрица».
Пока другие исследователи старались довести количество пальцев на руках сгенерированных людей до пяти (а члены гильдии актёров противостояли им), в OpenAI решили замахнуться на короткие (до минуты), но высококачественные и детализированные ролики — и, чёрт возьми, у них получилось!
Согласен, качество роликов прорывное, но...
1. Доступа к Sora нет - мы не можем узнать, насколько сложно создавать такие ролики.
2. Может быть там один ролик из миллиона нормальный выходит? А все остальные - с дополнительными пальцами в не предназначенных для этого местах.
3. Мы не знаем, сколько ресурсов и времени надо для одного ролика. Может там для этого такой кластер GPU нужен, что приходится питать его атомным реактором. А генерация занимает столько времени, что быстрее будет снят ролик.
Как вначале написано - вопрос масштабирования это не вопрос :) я вижу проблему в применимости сетей. Фейковые видео будут везде после открытого релиза, если конечно вы не правы и реально не нужен кластер ГПУ на неделю для генерации минуты
Там по тексту есть примерные референсы на трудоемкость. На генерацию одной минуты уходит примерно час.