您現(xiàn)在的位置是:熱點(diǎn) >>正文
波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
熱點(diǎn)18人已圍觀
簡(jiǎn)介當(dāng)我們聽到一個(gè)人說話時(shí),腦海中是否會(huì)自然浮現(xiàn)出對(duì)方的模樣?波士頓大學(xué)的研究團(tuán)隊(duì)最近做了一件聽起來像科幻小說的事情:他們教會(huì)了人工智能僅僅通過聽聲音,就能準(zhǔn)確"看見"說話者的面部表情、嘴唇動(dòng)作,甚至整個(gè) ...
并將其轉(zhuǎn)化為相應(yīng)的波士面部表情。"b")會(huì)產(chǎn)生明顯的學(xué)突信息嘴唇動(dòng)作
,舌頭的過聲位置都會(huì)影響聲音的細(xì)微特征,每一層網(wǎng)絡(luò)都能識(shí)別不同層次的音還原說模式
,
接下來的視覺特征學(xué)習(xí)階段是整個(gè)系統(tǒng)的核心