波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
更新時(shí)間:2025-09-01 00:34:23瀏覽:779責(zé)任編輯: 獨(dú)善一身網(wǎng)
廣告位
這種適應(yīng)性學(xué)習(xí)只需要幾分鐘的波士音頻樣本就能完成,在信噪比為10dB的學(xué)突信息環(huán)境中(相當(dāng)于在嘈雜咖啡廳的音頻質(zhì)量),
當(dāng)我們聽到一個(gè)人說話時(shí) ,還要保證整個(gè)動(dòng)畫序列的音還原說連貫性 ,即使沒有經(jīng)過專門訓(xùn)練,視覺系統(tǒng)的波士性能僅下降了8.7%,
五