微軟解鎖 AI 配音新技能:最長 90 秒多角色敘述,語音更像真人
更新時(shí)間:2025-09-01 01:22:23瀏覽:361責(zé)任編輯: 獨(dú)善一身網(wǎng)
廣告位
輸出的微軟成品不像單調(diào)的機(jī)器朗讀 ,支持十余種聲音與風(fēng)格組合。解鎖功能是配音讓輸出的音頻更接近真人,選用“Oak”音色和“narration”敘述風(fēng)格,新技像將模擬火車站的長秒腳本輸入系統(tǒng)
。讓該工具不僅適用于簡單朗誦,多角
例如輸入“講一個(gè)貓?jiān)诎堤帩撔幸捠车墓适隆?,
該媒體在測試 Emotive 模式后,用戶無需注冊(cè)即可直接體驗(yàn)
,微軟并可下載 MP3 格式音頻,解鎖并巧妙穿插互動(dòng),配音科技媒體 Windows Latest 昨日(8 月 29 日)發(fā)布博文,新技像中文及其他語言用戶暫無法直接生成母語音頻,長秒可通過 Emotive 和 Story 兩種模式生成更具情感的多角英文語音。形成自然流暢的色敘述語對(duì)話效果。用戶僅需提供主題提示
。AI 就生成了一個(gè)長達(dá) 90 秒的多角色敘述
:旁白用美式口音,更像是一次配音合作,也可勝任有多角色的創(chuàng)意作品制作
。 IT之家 8 月 30 日消息
,并可根據(jù)需求加入創(chuàng)意潤色。還自動(dòng)增添細(xì)節(jié)、報(bào)道稱微軟在 Copilot Labs 推出全新 AI 語音生成工具 Copilot Audio Expressions
,方便在任何設(shè)備播放。 在 Story 模式下
,讓表達(dá)更生動(dòng)。單段音頻最長 59 秒
,貓的對(duì)白則為英式口音
, 該工具目前提供 Emotive(情感表達(dá))和 Story(故事創(chuàng)作)兩種模式
。 生成的音頻不僅朗讀了文字