微軟解鎖 AI 配音新技能:最長 90 秒多角色敘述,語音更像真人
并可根據(jù)需求加入創(chuàng)意潤色 。微軟并巧妙穿插互動 ,解鎖輸出的配音成品不像單調(diào)的機(jī)器朗讀
,科技媒體 Windows Latest 昨日(8 月 29 日)發(fā)布博文 ,新技像將模擬火車站的長秒腳本輸入系統(tǒng)
。貓的多角對白則為英式口音,調(diào)整措辭,色敘述語用戶無需注冊即可直接體驗(yàn),音更AI 就生成了一個(gè)長達(dá) 90 秒的微軟多角色敘述:旁白用美式口音
,支持十余種聲音與風(fēng)格組合
。解鎖Story 模式在情節(jié)構(gòu)建、配音可通過 Emotive 和 Story 兩種模式生成更具情感的新技像英文語音
。讓表達(dá)更生動。長秒形成自然流暢的多角對話效果。
該媒體在測試 Emotive 模式后 ,單段音頻最長 59 秒,報(bào)道稱微軟在 Copilot Labs 推出全新 AI 語音生成工具 Copilot Audio Expressions,
例如輸入“講一個(gè)貓?jiān)诎堤帩撔幸捠车墓适隆?,
在 Story 模式下,
該工具目前僅支持英文,微軟尚未透露后續(xù)是否會增加多語言支持 。
測試結(jié)果表明,并可下載 MP3 格式音頻,功能是讓輸出的音頻更接近真人 ,角色區(qū)分及聲音融合度方面表現(xiàn)出色 ,選用“Oak”音色和“narration”敘述風(fēng)格 ,中文及其他語言用戶暫無法直接生成母語音頻,用戶僅需提供主題提示