波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
發(fā)布時間:2025-08-31 23:54:40 作者:玩站小弟
我要評論

當我們聽到一個人說話時,腦海中是否會自然浮現(xiàn)出對方的模樣?波士頓大學(xué)的研究團隊最近做了一件聽起來像科幻小說的事情:他們教會了人工智能僅僅通過聽聲音,就能準確"看見"說話者的面部表情、嘴唇動作,甚至整個
。
比如
,波士系統(tǒng)會將原始音頻信號轉(zhuǎn)換成頻譜圖,學(xué)突信息
研究團隊還進行了與人類能力的過聲對比實驗