Make-A-Video пока на ранней стадии разработки, поэтому видео выходят в низком качестве и с заметными артефактами.
Вряд ли нейросеть сама генерит ролики, это уж слишком сложно и ближе к ИИ было бы. Скорее всего она ищет с Ютуба и прочих видеоресурсом похожие ролики по описанию, хэштегам, образам внутри и т.п. параметрам и выдает результат.
Про генерацию картинок точно так же говорили :)