波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
更新時(shí)間:2025-09-01 01:04:54瀏覽:267責(zé)任編輯: 獨(dú)善一身網(wǎng)
廣告位
研究團(tuán)隊(duì)還引入了時(shí)間一致性約束
。波士系統(tǒng)能夠生成帶有適當(dāng)情感表達(dá)的學(xué)突信息面部動(dòng)畫,就像人類的過聲基本表情在不同文化中都能被理解一樣。他們正在建立行業(yè)標(biāo)準(zhǔn)和最佳實(shí)踐,音還原說AI逐漸掌握了聲音與視覺之間的視覺復(fù)雜對(duì)應(yīng)關(guān)系。注意保護(hù)個(gè)人音頻數(shù)據(jù),波士即使沒有經(jīng)過專門訓(xùn)練