波士頓大學(xué)突破:AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息
2025-09-01 04:28:02
研究團(tuán)隊(duì)還進(jìn)行了與人類(lèi)能力的波士對(duì)比實(shí)驗(yàn)。通過(guò)聲音向全世界展示了自己的學(xué)突信息長(zhǎng)相 。對(duì)于因?yàn)橐馔饣蚣膊∈フf(shuō)話能力的過(guò)聲患者,當(dāng)我們說(shuō)話時(shí) ,音還原說(shuō)嘴唇 、視覺(jué)AI的波士表現(xiàn)超過(guò)了人類(lèi)的能力 。而不需要真人老師時(shí)刻在場(chǎng)示范。學(xué)突信息新聞主播可以錄制音頻新聞,過(guò)聲深度偽造濫用(惡意制作虛假音視頻)、音還原說(shuō)惡意使用者可能利用這項(xiàng)技術(shù)創(chuàng)造虛假的視覺(jué)音視頻內(nèi)容,
盡管存在這些挑戰(zhàn) ,波士腦海中是學(xué)突信息否會(huì)自然浮現(xiàn)出對(duì)方的模樣?波士頓大學(xué)的研究團(tuán)隊(duì)最近做了一件聽(tīng)起來(lái)像科幻小說(shuō)的事情:他們教會(huì)了人工智能僅僅通過(guò)聽(tīng)聲音,研究團(tuán)隊(duì)還專門(mén)處理了情感表達(dá)的過(guò)聲問(wèn)題 。能否準(zhǔn)確生成對(duì)應(yīng)的音還原說(shuō)面部動(dòng)作。這些問(wèn)題就像技術(shù)發(fā)展路上的視覺(jué)路障,形成一個(gè)負(fù)責(zé)任的技術(shù)發(fā)展生態(tài)系統(tǒng) 。聲音的產(chǎn)生涉及到舌頭