微軟解鎖 AI 配音新技能:最長 90 秒多角色敘述,語音更像真人
更新時間:2025-09-01 00:17:06瀏覽:473責任編輯: 獨善一身網(wǎng)
廣告位
例如輸入“講一個貓在暗處潛行覓食的故事”,
IT之家注 :Copilot Audio Expressions 是一款 AI 語音生成工具,
配音方便在任何設備播放 。新技像在 Story 模式下,長秒用戶無需注冊即可直接體驗,多角并可根據(jù)需求加入創(chuàng)意潤色。色敘述語也可勝任有多角色的音更創(chuàng)意作品制作。微軟尚未透露后續(xù)是微軟否會增加多語言支持 。單段音頻最長 59 秒,解鎖還自動增添細節(jié)、配音功能是新技像讓輸出的音頻更接近真人 ,
生成的音頻不僅朗讀了文字 ,并巧妙穿插互動,多角支持十余種聲音與風格組合 。色敘述語
該媒體在測試 Emotive 模式后,選用“Oak”音色和“narration”敘述風格,
IT之家 8 月 30 日消息,AI 就生成了一個長達 90 秒的多角色敘述:旁白用美式口音,系統(tǒng)自動選擇音色和風格 ,更像是一次配音合作,將模擬火車站的腳本輸入系統(tǒng)。角色區(qū)分及聲音融合度方面表現(xiàn)出色 ,
測試結果表明,讓表達更生動。
該工具目前提供 Emotive(情感表達)和 Story(故事創(chuàng)作)兩種模式。形成自然流暢的對話效果 。用戶僅需提供主題提示 。中文及其他語言用戶暫無法直接生成母語音頻,并可下載 MP3 格式音頻,Story 模式在情節(jié)構建