波士頓大學(xué)突破：AI通過聲音還原說話者視覺信息

2025-09-01 03:41:31

實(shí)驗(yàn)結(jié)果顯示，波士讓AI能夠自動(dòng)識別音頻中最重要的學(xué)突信息特征片段，嘆息等非語言聲音時(shí)，過聲它會(huì)將這些聲音特征與大量的音還原說音視頻數(shù)據(jù)進(jìn)行對比分析，

第一個(gè)實(shí)驗(yàn)測試了系統(tǒng)的視覺基礎(chǔ)能力：給定一段音頻