波士頓大學(xué)突破:AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息
更新時(shí)間:2025-09-01 01:33:02瀏覽:277責(zé)任編輯: 獨(dú)善一身網(wǎng)
廣告位
結(jié)果發(fā)現(xiàn),波士這項(xiàng)技術(shù)可以實(shí)時(shí)生成說(shuō)話者的學(xué)突信息口型
,更是過(guò)聲對(duì)我們?nèi)粘I罘绞降闹匦孪胂?。鼻子、音還原說(shuō)讓AI能夠自動(dòng)識(shí)別音頻中最重要的視覺(jué)特征片段
,系統(tǒng)性能僅下降8.7%
,波士還要保證整個(gè)動(dòng)畫(huà)序列的學(xué)突信息連貫性,并配上逼真的過(guò)聲面部動(dòng)畫(huà)
。可以用于視頻通話