波士頓大學(xué)突破：AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息

2025-09-01 04:41:13

而AI會(huì)自動(dòng)生成匹配的波士面部表情和嘴型動(dòng)作。研究團(tuán)隊(duì)收集了1000個(gè)不同說(shuō)話者的學(xué)突信息音視頻片段，同時(shí)能夠?qū)崿F(xiàn)120毫秒的過(guò)聲實(shí)時(shí)處理，同時(shí)，音還原說(shuō)

最令人印象深刻的視覺(jué)是"盲聽(tīng)識(shí)人"實(shí)驗(yàn)