波士頓大學(xué)突破:AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息
0
系統(tǒng)可以自動(dòng)生成流暢的波士面部動(dòng)畫(huà)來(lái)替代;對(duì)于聽(tīng)力障礙人士,這種適應(yīng)性學(xué)習(xí)只需要幾分鐘的學(xué)突信息音頻樣本就能完成,系統(tǒng)仍能保持較高的過(guò)聲準(zhǔn)確性。這已經(jīng)是音還原說(shuō)一個(gè)相當(dāng)了不起的成就 。研究團(tuán)隊(duì)使用了超過(guò)100萬(wàn)小時(shí)的視覺(jué)音視頻對(duì)話數(shù)據(jù)