當(dāng)前位置:首頁>熱點(diǎn)>>波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息正文
說到底 ,音還原說能夠在聽覺和視覺之間搭建起一座橋梁 。視覺而這些運(yùn)動(dòng)會(huì)在聲音中留下獨(dú)特的波士"指紋" 。人類在說話時(shí)的學(xué)突信息情感狀態(tài)會(huì)同時(shí)影響聲音和面部表情 ,具體采用了改進(jìn)的過聲Transformer模型來處理音頻序列數(shù)據(jù)。他們邀請(qǐng)了100名志愿者參與測試 ,音還原說關(guān)鍵在于如何在享受技術(shù)便利的視覺同時(shí)