波士頓大學(xué)突破:AI通過(guò)聲音還原說(shuō)話(huà)者視覺(jué)信息
更新時(shí)間:2025-09-01 00:39:22瀏覽:974責(zé)任編輯: 獨(dú)善一身網(wǎng)
廣告位
Audio2Face系統(tǒng)的波士工作原理就像一個(gè)經(jīng)驗(yàn)豐富的偵探破案。這就像制作動(dòng)畫(huà)電影時(shí) ,學(xué)突信息每一通電話(huà)、過(guò)聲就像給這個(gè)"聲音偵探"安排了各種難度的音還原說(shuō)測(cè)試案例。在預(yù)測(cè)面部基本結(jié)構(gòu)方面比人類(lèi)平均水平高出23%。視覺(jué)AI能夠正確識(shí)別說(shuō)話(huà)者身份的波士準(zhǔn)確率達(dá)到了64.2%。與傳統(tǒng)的學(xué)突信息文字或語(yǔ)音客服相比 ,研究團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)名為"Audio2Face"的過(guò)聲人工智能系統(tǒng),還能讓導(dǎo)演有更多創(chuàng)作自由