波士頓大學(xué)突破：AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息

2025-09-01 05:39:49

AI需要預(yù)測(cè)這些標(biāo)志點(diǎn)在每個(gè)時(shí)間點(diǎn)的波士精確坐標(biāo)，

研究團(tuán)隊(duì)還進(jìn)行了與人類能力的學(xué)突信息對(duì)比實(shí)驗(yàn) 。AI需要學(xué)會(huì)識(shí)別聲音中哪些特征對(duì)應(yīng)著特定的過(guò)聲面部動(dòng)作。從而生成更加準(zhǔn)確的音還原說(shuō)個(gè)人化結(jié)果。這使得它能夠處理多語(yǔ)言的視覺(jué)音頻輸入。這為虛擬現(xiàn)實(shí)游戲帶來(lái)了新的波士可能性