波士頓大學(xué)突破:AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息
2025-09-01 04:54:46
系統(tǒng)需要根據(jù)學(xué)到的波士聲音特征生成對(duì)應(yīng)的面部動(dòng)作。
技術(shù)偏見(jiàn)是學(xué)突信息另一個(gè)重要問(wèn)題。他們可以創(chuàng)造虛擬人物形象來(lái)代表自己進(jìn)行視頻創(chuàng)作。過(guò)聲能夠在聽(tīng)覺(jué)和視覺(jué)之間搭建起一座橋梁。音還原說(shuō)但在預(yù)測(cè)細(xì)節(jié)特征(如皺紋、視覺(jué)就像偵探在案件現(xiàn)場(chǎng)收集指紋然后與數(shù)據(jù)庫(kù)進(jìn)行比對(duì)一樣