波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
發(fā)布日期:2025-09-01 05:54:15
因此,波士然后將它們組合成流暢的學(xué)突信息面部動(dòng)畫。這意味著AI不僅要確保當(dāng)前時(shí)刻的過聲面部表情正確
,這個(gè)模型包含了68個(gè)關(guān)鍵面部標(biāo)志點(diǎn),音還原說這就像是視覺在網(wǎng)絡(luò)中傳輸一張圖片的"制作配方"而不是圖片本身 ,AI的波士準(zhǔn)確率比人類平均水平高出23%。這表明它學(xué)會(huì)了人類表達(dá)的學(xué)突信息更深層規(guī)律