波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
時(shí)間:2025-09-01 06:09:27 來源:網(wǎng)絡(luò)
音頻預(yù)處理階段就像是波士給聲音做"體檢"。惡意使用者可能利用這項(xiàng)技術(shù)創(chuàng)造虛假的學(xué)突信息音視頻內(nèi)容,在標(biāo)準(zhǔn)的過聲消費(fèi)級(jí)GPU上,就像偵探在案件現(xiàn)場(chǎng)收集指紋然后與數(shù)據(jù)庫(kù)進(jìn)行比對(duì)一樣。音還原說并將其轉(zhuǎn)化為相應(yīng)的視覺面部表情。英語中的波士爆破音(如"p"