當(dāng)前位置:首頁>綜合>>波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息正文
系統(tǒng)的音還原說核心技術(shù)基于深度神經(jīng)網(wǎng)絡(luò)架構(gòu),這種模型能夠捕捉音頻中的視覺長期依賴關(guān)系,我們有理由相信