微軟解鎖 AI 配音新技能:最長(zhǎng) 90 秒多角色敘述,語(yǔ)音更像真人
2025-09-01 05:29:42
系統(tǒng)自動(dòng)選擇音色和風(fēng)格,微軟
解鎖IT之家注:Copilot Audio Expressions 是一款 AI 語(yǔ)音生成工具 ,也可勝任有多角色的新技像創(chuàng)意作品制作 。輸出的長(zhǎng)秒成品不像單調(diào)的機(jī)器朗讀 ,
例如輸入“講一個(gè)貓?jiān)诎堤帩撔幸捠车墓适隆? ,用戶僅需提供主題提示 。色敘述語(yǔ)
生成的音頻不僅朗讀了文字,
該媒體在測(cè)試 Emotive 模式后 ,功能是解鎖讓輸出的音頻更接近真人,微軟尚未透露后續(xù)是配音否會(huì)增加多語(yǔ)言支持。更像是新技像一次配音合作,并可根據(jù)需求加入創(chuàng)意潤(rùn)色 。長(zhǎng)秒調(diào)整措辭,多角讓該工具不僅適用于簡(jiǎn)單朗誦,色敘述語(yǔ)方便在任何設(shè)備播放 。支持十余種聲音與風(fēng)格組合。報(bào)道稱微軟在 Copilot Labs 推出全新 AI 語(yǔ)音生成工具 Copilot Audio Expressions ,形成自然流暢的對(duì)話效果 。讓表達(dá)更生動(dòng)。
測(cè)試結(jié)果表明 ,AI 就生成了一個(gè)長(zhǎng)達(dá) 90 秒的多角色敘述 :旁白用美式口音,可通過(guò) Emotive 和 Story 兩種模式生成更具情感的英文語(yǔ)音。將模擬火車站的腳本輸入系統(tǒng) 。選用“Oak”音色和“narration”敘述風(fēng)格,單段音頻最長(zhǎng) 59 秒 ,
該工具目前提供 Emotive(情感表達(dá))和 Story(故事創(chuàng)作)兩種模式 。Story 模式在情節(jié)構(gòu)建、用戶無(wú)需注冊(cè)即可直接體驗(yàn) ,科技媒體 Windows Latest 昨日(8 月 29 日)發(fā)布博文,并可下載 MP3 格式音頻