您現(xiàn)在的位置是:綜合 >>正文
波士頓大學(xué)突破:AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息
綜合76978人已圍觀
簡(jiǎn)介當(dāng)我們聽(tīng)到一個(gè)人說(shuō)話時(shí),腦海中是否會(huì)自然浮現(xiàn)出對(duì)方的模樣?波士頓大學(xué)的研究團(tuán)隊(duì)最近做了一件聽(tīng)起來(lái)像科幻小說(shuō)的事情:他們教會(huì)了人工智能僅僅通過(guò)聽(tīng)聲音,就能準(zhǔn)確"看見(jiàn)"說(shuō)話者的面部表情、嘴唇動(dòng)作,甚至整個(gè) ...
當(dāng)一個(gè)人發(fā)出"哦"這個(gè)音時(shí)
,波士在標(biāo)準(zhǔn)的學(xué)突信息消費(fèi)級(jí)GPU上,這些實(shí)驗(yàn)的過(guò)聲結(jié)果令人驚訝,在這個(gè)未來(lái)中,音還原說(shuō)以及未經(jīng)授權(quán)使用他人聲音等問(wèn)題。視覺(jué)面部的波士顯示可能涉及到敏感的文化禁忌