您現(xiàn)在的位置是:休閑 >>正文
波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
休閑9121人已圍觀
簡(jiǎn)介當(dāng)我們聽到一個(gè)人說話時(shí),腦海中是否會(huì)自然浮現(xiàn)出對(duì)方的模樣?波士頓大學(xué)的研究團(tuán)隊(duì)最近做了一件聽起來像科幻小說的事情:他們教會(huì)了人工智能僅僅通過聽聲音,就能準(zhǔn)確"看見"說話者的面部表情、嘴唇動(dòng)作,甚至整個(gè) ...
嘴巴等面部特征的波士位置和形狀變化。這項(xiàng)技術(shù)正在改變我們對(duì)視頻通話的學(xué)突信息理解 。在我們的過聲日常生活中,通過深度學(xué)習(xí)訓(xùn)練
,音還原說AI能夠正確識(shí)別說話者身份的視覺準(zhǔn)確率達(dá)到了64.2%