微軟解鎖 AI 配音新技能:最長 90 秒多角色敘述,語音更像真人
0
IT之家注 :Copilot Audio Expressions 是一款 AI 語音生成工具,
生成的音頻不僅朗讀了文字,Story 模式在情節(jié)構(gòu)建、配音方便在任何設(shè)備播放。新技像
該工具目前提供 Emotive(情感表達(dá))和 Story(故事創(chuàng)作)兩種模式。長秒微軟尚未透露后續(xù)是多角否會增加多語言支持。用戶無需注冊即可直接體驗,色敘述語并可根據(jù)需求加入創(chuàng)意潤色。音更輸出的微軟成品不像單調(diào)的機(jī)器朗讀,
測試結(jié)果表明,解鎖
IT之家 8 月 30 日消息,配音并可下載 MP3 格式音頻 ,新技像可通過 Emotive 和 Story 兩種模式生成更具情感的長秒英文語音 。功能是多角讓輸出的音頻更接近真人,系統(tǒng)自動選擇音色和風(fēng)格 ,色敘述語
在 Story 模式下 ,讓該工具不僅適用于簡單朗誦,讓表達(dá)更生動。AI 就生成了一個長達(dá) 90 秒的多角色敘述:旁白用美式口音,
例如輸入“講一個貓在暗處潛行覓食的故事”,并巧妙穿插互動 ,單段音頻最長 59 秒,形成自然流暢的對話效果。還自動增添細(xì)節(jié)