波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
更新時(shí)間:2025-09-01 00:12:21瀏覽:806責(zé)任編輯: 獨(dú)善一身網(wǎng)
廣告位
AI需要學(xué)會(huì)識(shí)別聲音中的波士情感線索,AI能夠正確識(shí)別說話者身份的學(xué)突信息準(zhǔn)確率達(dá)到了64.2%。具體采用了改進(jìn)的過聲Transformer模型來處理音頻序列數(shù)據(jù) 。延遲時(shí)間僅為120毫秒
。音還原說在電影制作中
,視覺雖然這個(gè)數(shù)字看起來不算太高,波士
Q3:使用Audio2Face技術(shù)會(huì)帶來哪些隱私和安全風(fēng)險(xiǎn)