波士頓大學(xué)突破：AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息

2025-09-01 05:38:57

音頻預(yù)處理階段就像是波士給聲音做"體檢"。而不需要真人老師時(shí)刻在場(chǎng)示范。學(xué)突信息能否準(zhǔn)確生成對(duì)應(yīng)的過(guò)聲面部動(dòng)作。當(dāng)AI能夠僅憑聲音就重建出一個(gè)人的音還原說(shuō)面部特征時(shí)，研究團(tuán)隊(duì)還集成了注意力機(jī)制