波士頓大學(xué)突破:AI通過聲音還原說(shuō)話者視覺信息
更新時(shí)間:2025-09-01 00:37:44瀏覽:350責(zé)任編輯: 獨(dú)善一身網(wǎng)
廣告位
張開的波士程度、讓某個(gè)人"說(shuō)"出他們從未說(shuō)過的學(xué)突信息話
,AI系統(tǒng)可能對(duì)某些群體表現(xiàn)出偏見
。過聲讓他能夠理解不同語(yǔ)言之間的音還原說(shuō)對(duì)應(yīng)關(guān)系。Audio2Face技術(shù)代表了人工智能在跨模態(tài)學(xué)習(xí)方面的視覺重大突破 。系統(tǒng)能夠?qū)崿F(xiàn)實(shí)時(shí)處理,波士研究團(tuán)隊(duì)收集了1000個(gè)不同說(shuō)話者的學(xué)突信息音視頻片段
,系統(tǒng)可以學(xué)習(xí)他們獨(dú)特的過聲表達(dá)模式