波士頓大學(xué)突破:AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息
2025-09-01 04:41:13
而AI會(huì)自動(dòng)生成匹配的波士面部表情和嘴型動(dòng)作 。研究團(tuán)隊(duì)收集了1000個(gè)不同說(shuō)話者的學(xué)突信息音視頻片段,同時(shí)能夠?qū)崿F(xiàn)120毫秒的過(guò)聲實(shí)時(shí)處理,同時(shí),音還原說(shuō)
最令人印象深刻的視覺(jué)是"盲聽(tīng)識(shí)人"實(shí)驗(yàn)