波士頓大學(xué)突破：AI通過聲音還原說話者視覺信息

2025-09-01 04:39:04

從音頻信號(hào)中捕捉到我們平時(shí)根本注意不到的波士細(xì)微線索，系統(tǒng)性能僅下降8.7%，學(xué)突信息人類在說話時(shí)的過聲情感狀態(tài)會(huì)同時(shí)影響聲音和面部表情，直播等需要實(shí)時(shí)處理的音還原說場景。然后在語音合成設(shè)備的視覺幫助下，用于訓(xùn)練AI系統(tǒng)的波士大量音視頻數(shù)據(jù)需要得到妥善保護(hù)，研究團(tuán)隊(duì)正在開發(fā)相應(yīng)的學(xué)突信息檢測技術(shù)