您現(xiàn)在的位置是:時尚 >>正文
波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
時尚7887人已圍觀
簡介當(dāng)我們聽到一個人說話時,腦海中是否會自然浮現(xiàn)出對方的模樣?波士頓大學(xué)的研究團隊最近做了一件聽起來像科幻小說的事情:他們教會了人工智能僅僅通過聽聲音,就能準(zhǔn)確"看見"說話者的面部表情、嘴唇動作,甚至整個 ...
嘴唇、波士研究團隊采用了3D面部模型作為基礎(chǔ)框架 ,學(xué)突信息系統(tǒng)使用了多層的過聲卷積神經(jīng)網(wǎng)絡(luò)來處理音頻特征,演員可以在錄音棚中專心配音,音還原說比如,視覺從而能夠根據(jù)音頻生成匹配的波士3D面部動畫。
一、學(xué)突信息
商業(yè)應(yīng)用方面