波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
時(shí)間:2025-09-01 06:19:51 來源:網(wǎng)絡(luò)
臉頰等器官的波士運(yùn)動(dòng)模式。觀看者很難區(qū)分AI生成的學(xué)突信息動(dòng)畫和真實(shí)的視頻片段。就像偵探在案件現(xiàn)場(chǎng)收集指紋然后與數(shù)據(jù)庫進(jìn)行比對(duì)一樣。過聲系統(tǒng)使用了多層的音還原說卷積神經(jīng)網(wǎng)絡(luò)來處理音頻特征