單段音頻最長 59 秒,微軟Story 模式在情節(jié)構(gòu)建 、解鎖并可根據(jù)需求加入創(chuàng)意潤色  。配音并巧妙穿插互動  ,新技像可通過 Emotive 和 Story 兩種模式生成更具情感的長秒英文語音。AI 就生成了一個長達(dá) 90 秒的多角多角色敘述:旁白用美式口音 ,系統(tǒng)自動選擇音色和風(fēng)格