Человек пишет текст (иногда с помощью продвинутой нейронки, но полностью доверить машине такую задачу нереально - вероятно все пробовали писать стихи в чат гпт), затем подбирает инструменты, вокалиста, пишет сценарий композиции, размечает таймкоды, артикуляцию вокала, интонации, акценты и прочее (композиторы поймут), и нейропомошник делает несколько вариантов, из которых выбирается лучший и доводится до совершенства. Примерно как с нейро фотографией, когда один грамотный человек может достаточно быстро сделать работу большой съемочной команды.