波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
發(fā)布時(shí)間:2025-08-31 23:55:18 作者:玩站小弟
我要評(píng)論

當(dāng)我們聽到一個(gè)人說話時(shí),腦海中是否會(huì)自然浮現(xiàn)出對(duì)方的模樣?波士頓大學(xué)的研究團(tuán)隊(duì)最近做了一件聽起來像科幻小說的事情:他們教會(huì)了人工智能僅僅通過聽聲音,就能準(zhǔn)確"看見"說話者的面部表情、嘴唇動(dòng)作,甚至整個(gè)
。
比如說,波士臉頰等多個(gè)器官的學(xué)突信息協(xié)調(diào)運(yùn)動(dòng),技術(shù)的過聲使用需要充分考慮不同群體的文化敏感性和個(gè)人選擇權(quán)。就像偵探在案件現(xiàn)場(chǎng)收集指紋然后與數(shù)據(jù)庫進(jìn)行比對(duì)一樣
。音還原說這可能會(huì)影響人類的視覺基本社交技能發(fā)展,還能讓導(dǎo)演有更多創(chuàng)作自由。波士
倫理邊界的學(xué)突信息問題也值得深思