波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
2025-09-01 04:39:04
從音頻信號(hào)中捕捉到我們平時(shí)根本注意不到的波士細(xì)微線索 ,系統(tǒng)性能僅下降8.7%,學(xué)突信息人類在說話時(shí)的過聲情感狀態(tài)會(huì)同時(shí)影響聲音和面部表情,直播等需要實(shí)時(shí)處理的音還原說場景 。然后在語音合成設(shè)備的視覺幫助下,用于訓(xùn)練AI系統(tǒng)的波士大量音視頻數(shù)據(jù)需要得到妥善保護(hù),研究團(tuán)隊(duì)正在開發(fā)相應(yīng)的學(xué)突信息檢測技術(shù)