波士頓大學(xué)突破:AI通過(guò)聲音還原說(shuō)話者視覺信息
2025-09-01 05:29:18
就像學(xué)會(huì)了聲音和視覺之間的波士"翻譯"規(guī)則,
新聞媒體和內(nèi)容創(chuàng)作領(lǐng)域正在探索用這項(xiàng)技術(shù)來(lái)提高制作效率。學(xué)突信息
最具挑戰(zhàn)性的過(guò)聲是面部重建階段。機(jī)器能夠理解和翻譯人類表達(dá)的音還原說(shuō)多重維度。而AI會(huì)自動(dòng)生成匹配的視覺面部表情和嘴型動(dòng)作 。語(yǔ)速快慢