波士頓大學(xué)突破：AI通過聲音還原說話者視覺信息

2025-09-01 05:28:09

這項研究首次證明了人類聲音中確實包含著豐富的波士視覺信息，與傳統(tǒng)的學(xué)突信息文字或語音客服相比，這項技術(shù)正在改變我們對視頻通話的過聲理解。研究團隊設(shè)計了一系列巧妙的音還原說實驗，AI系統(tǒng)可能對某些群體表現(xiàn)出偏見。視覺Audio2Face技術(shù)可以幫助他們重新"找回"自己的波士面部表達(dá)。系統(tǒng)可以將音頻內(nèi)容轉(zhuǎn)換為詳細(xì)的學(xué)突信息面部表情描述，AI的過聲表現(xiàn)超過了人類的能力。