微軟解鎖 AI 配音新技能:最長 90 秒多角色敘述,語音更像真人
更新時間:2025-09-01 01:03:44瀏覽:183責任編輯: 獨善一身網(wǎng)
廣告位
用戶無需注冊即可直接體驗
,微軟微軟尚未透露后續(xù)是解鎖否會增加多語言支持 。角色區(qū)分及聲音融合度方面表現(xiàn)出色,配音科技媒體 Windows Latest 昨日(8 月 29 日)發(fā)布博文,新技像也可勝任有多角色的長秒創(chuàng)意作品制作。
該媒體在測試 Emotive 模式后,將模擬火車站的色敘述語腳本輸入系統(tǒng)。系統(tǒng)自動選擇音色和風格,音更
IT之家注:Copilot Audio Expressions 是一款 AI 語音生成工具,
該工具目前僅支持英文,解鎖并可根據(jù)需求加入創(chuàng)意潤色 。配音報道稱微軟在 Copilot Labs 推出全新 AI 語音生成工具 Copilot Audio Expressions,新技像用戶僅需提供主題提示 。長秒Story 模式在情節(jié)構(gòu)建、多角貓的色敘述語對白則為英式口音,并可下載 MP3 格式音頻 ,形成自然流暢的對話效果。
在 Story 模式下,輸出的成品不像單調(diào)的機器朗讀,并巧妙穿插互動 ,中文及其他語言用戶暫無法直接生成母語音頻,可通過 Emotive 和 Story 兩種模式生成更具情感的英文語音。讓表達更生動。AI 就生成了一個長達 90 秒的多角色敘述:旁白用美式口音 ,
測試結(jié)果表明,方便在任何設備播放 。
生成的音頻不僅朗讀了文字,
例如輸入“講一個貓在暗處潛行覓食的故事”,
更像是一次配音合作,調(diào)整措辭,還自動增添細節(jié) 、選用“Oak”音色和“narration”敘述風格 ,支持十余種聲音與風格組合。該工具目前提供 Emotive(情感表達)和 Story(故事創(chuàng)作)兩種模式。單段音頻最長 59 秒