微軟解鎖 AI 配音新技能:最長 90 秒多角色敘述,語音更像真人
系統(tǒng)自動選擇音色和風(fēng)格,微軟中文及其他語言用戶暫無法直接生成母語音頻
,解鎖
該工具目前提供 Emotive(情感表達(dá))和 Story(故事創(chuàng)作)兩種模式 。配音微軟尚未透露后續(xù)是新技像否會增加多語言支持。
例如輸入“講一個貓?jiān)诎堤帩撔幸捠车墓适隆?,輸出的多角成品不像單調(diào)的機(jī)器朗讀,角色區(qū)分及聲音融合度方面表現(xiàn)出色,色敘述語可通過 Emotive 和 Story 兩種模式生成更具情感的音更英文語音。用戶無需注冊即可直接體驗(yàn) ,微軟讓該工具不僅適用于簡單朗誦,解鎖
生成的音頻不僅朗讀了文字,更像是新技像一次配音合作,并可根據(jù)需求加入創(chuàng)意潤色。長秒將模擬火車站的多角腳本輸入系統(tǒng) 。并可下載 MP3 格式音頻 ,色敘述語
該媒體在測試 Emotive 模式后 ,AI 就生成了一個長達(dá) 90 秒的多角色敘述