波士頓大學突破:AI通過聲音還原說話者視覺信息
0
Audio2Face技術可以幫助他們重新"找回"自己的波士面部表達。AI生成的學突信息面部動畫與真實視頻的匹配度達到了87.3%,系統(tǒng)自動生成個性化的過聲卡通或真實面部動畫 。
無障礙技術應用展現(xiàn)了這項技術的音還原說社會價值 。確保在不影響系統(tǒng)性能的視覺前提下保護用戶隱私。具體采用了改進的波士Transformer模型來處理音頻序列數據。然后將這些線索拼湊成完整的學突信息視覺畫面。通過聲音向全世界展示了自己的過聲長相。帶有面部表情的音還原說虛擬客服能夠提供更加人性化的服務體驗,聲音和圖像之間的視覺界限變得模糊