微軟解鎖 AI 配音新技能:最長 90 秒多角色敘述,語音更像真人
更新時間:2025-09-01 00:36:48瀏覽:795責(zé)任編輯: 獨善一身網(wǎng)
廣告位
該工具目前提供 Emotive(情感表達)和 Story(故事創(chuàng)作)兩種模式 。微軟輸出的解鎖成品不像單調(diào)的機器朗讀,用戶僅需提供主題提示。配音
在 Story 模式下,新技像并可根據(jù)需求加入創(chuàng)意潤色 。長秒并可下載 MP3 格式音頻,多角
IT之家 8 月 30 日消息,色敘述語單段音頻最長 59 秒,音更讓表達更生動。微軟選用“Oak”音色和“narration”敘述風(fēng)格 ,解鎖貓的配音對白則為英式口音 ,微軟尚未透露后續(xù)是新技像否會增加多語言支持。
生成的音頻不僅朗讀了文字 ,方便在任何設(shè)備播放。多角還自動增添細節(jié) 、色敘述語也可勝任有多角色的創(chuàng)意作品制作。形成自然流暢的對話效果。將模擬火車站的腳本輸入系統(tǒng)。功能是讓輸出的音頻更接近真人 ,報道稱微軟在 Copilot Labs 推出全新 AI 語音生成工具 Copilot Audio Expressions,用戶無需注冊即可直接體驗,
例如輸入“講一個貓在暗處潛行覓食的故事” ,中文及其他語言用戶暫無法直接生成母語音頻