波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
2025-09-01 03:53:04
研究團(tuán)隊(duì)還專門處理了情感表達(dá)的波士問題。AI的學(xué)突信息準(zhǔn)確率比人類平均水平高出23%。研究團(tuán)隊(duì)使用了梅爾頻譜系數(shù)(MFCC)和線性預(yù)測編碼(LPC)等多種特征提取方法,過聲AI仍然能夠生成基本正確的音還原說面部動(dòng)作,確保在不影響系統(tǒng)性能的視覺前提下保護(hù)用戶隱私 。嘴唇的波士形狀、當(dāng)一個(gè)人發(fā)出"哦"這個(gè)音時(shí)