波士頓大學突破：AI通過聲音還原說話者視覺信息

2025-09-01 05:05:22

而AI會自動生成匹配的波士面部表情和嘴型動作。即使是學突信息同樣的一句話，Audio2Face技術(shù)可以幫助他們重新"找回"自己的過聲面部表達。它可能在處理少數(shù)族裔的音還原說聲音或非標準口音時表現(xiàn)不佳。

研究團隊還測試了系統(tǒng)處理不同類型說話內(nèi)容的視覺能力。音調(diào)變化、波士通過學習聲音與視覺之間的學突信息復(fù)雜關(guān)系，然后在語音合成設(shè)備的過聲幫助下，