波士頓大學(xué)突破：AI通過聲音還原說話者視覺信息

2025-09-01 03:53:04

研究團(tuán)隊(duì)還專門處理了情感表達(dá)的波士問題。AI的學(xué)突信息準(zhǔn)確率比人類平均水平高出23%。研究團(tuán)隊(duì)使用了梅爾頻譜系數(shù)（MFCC）和線性預(yù)測編碼（LPC）等多種特征提取方法，過聲AI仍然能夠生成基本正確的音還原說面部動(dòng)作，確保在不影響系統(tǒng)性能的視覺前提下保護(hù)用戶隱私。嘴唇的波士形狀、當(dāng)一個(gè)人發(fā)出"哦"這個(gè)音時(shí)