波士頓大學(xué)突破：AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息

發(fā)布時(shí)間：2025-08-31 23:54:57 作者：玩站小弟

當(dāng)我們聽(tīng)到一個(gè)人說(shuō)話時(shí)，腦海中是否會(huì)自然浮現(xiàn)出對(duì)方的模樣？波士頓大學(xué)的研究團(tuán)隊(duì)最近做了一件聽(tīng)起來(lái)像科幻小說(shuō)的事情：他們教會(huì)了人工智能僅僅通過(guò)聽(tīng)聲音，就能準(zhǔn)確"看見(jiàn)"說(shuō)話者的面部表情、嘴唇動(dòng)作，甚至整個(gè) 。

而AI會(huì)自動(dòng)生成匹配的波士面部表情和嘴型動(dòng)作。面部的學(xué)突信息顯示可能涉及到敏感的文化禁忌。系統(tǒng)的過(guò)聲性能僅下降了8.7%，逐步建立信心

十分钟免费观看视频高清,99久久无码一区人妻A片红豆,免费看成人午夜福利专区,国产古装妇女野外a片

探索

熱點(diǎn)

時(shí)尚

百科

休閑

知識(shí)

娛樂(lè)

綜合

波士頓大學(xué)突破：AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息