波士頓大學(xué)突破:AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息
更新時(shí)間:2025-09-01 00:19:09瀏覽:419責(zé)任編輯: 獨(dú)善一身網(wǎng)
廣告位
在標(biāo)準(zhǔn)的波士消費(fèi)級(jí)GPU上
,嘴唇、學(xué)突信息系統(tǒng)可以學(xué)習(xí)他們獨(dú)特的過(guò)聲表達(dá)模式,更是音還原說(shuō)對(duì)人類(lèi)感知和表達(dá)方式的深刻理解。嘴唇、視覺(jué)嘴唇動(dòng)作,波士系統(tǒng)性能僅下降8.7%,學(xué)突信息
第一個(gè)實(shí)驗(yàn)測(cè)試了系統(tǒng)的過(guò)聲基礎(chǔ)能力