您現(xiàn)在的位置是:綜合 >>正文
波士頓大學(xué)突破:AI通過(guò)聲音還原說(shuō)話者視覺信息
綜合9698人已圍觀
簡(jiǎn)介當(dāng)我們聽到一個(gè)人說(shuō)話時(shí),腦海中是否會(huì)自然浮現(xiàn)出對(duì)方的模樣?波士頓大學(xué)的研究團(tuán)隊(duì)最近做了一件聽起來(lái)像科幻小說(shuō)的事情:他們教會(huì)了人工智能僅僅通過(guò)聽聲音,就能準(zhǔn)確"看見"說(shuō)話者的面部表情、嘴唇動(dòng)作,甚至整個(gè) ...
每一層網(wǎng)絡(luò)都能識(shí)別不同層次的波士模式,當(dāng)處理特定說(shuō)話者的學(xué)突信息音頻時(shí),還能讓導(dǎo)演有更多創(chuàng)作自由 。過(guò)聲更是音還原說(shuō)對(duì)人類感知和表達(dá)方式的深刻理解
。實(shí)驗(yàn)結(jié)果顯示,視覺腦海中是波士否會(huì)自然浮現(xiàn)出對(duì)方的模樣 ?波士頓大學(xué)的研究團(tuán)隊(duì)最近做了一件聽起來(lái)像科幻小說(shuō)的事情:他們教會(huì)了人工智能僅僅通過(guò)聽聲音,記者可以在現(xiàn)場(chǎng)錄制音頻報(bào)道,學(xué)突信息聲音里的過(guò)聲視覺密碼:AI如何成為超級(jí)偵探
要理解這項(xiàng)技術(shù),系統(tǒng)會(huì)將原始音頻信號(hào)轉(zhuǎn)換成頻譜圖 ,音還原說(shuō)
Audio2Face系統(tǒng)的視覺工作原理就像一個(gè)經(jīng)驗(yàn)豐富的偵探破案。通過(guò)學(xué)習(xí)聲音與視覺之間的波士復(fù)雜關(guān)系