波士頓大學(xué)突破:AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息
而這些特征恰恰是波士AI系統(tǒng)用來(lái)"看見(jiàn)"說(shuō)話者的關(guān)鍵線索。研究團(tuán)隊(duì)播放了50個(gè)不同說(shuō)話者的學(xué)突信息音頻片段,系統(tǒng)使用了多層的過(guò)聲卷積神經(jīng)網(wǎng)絡(luò)來(lái)處理音頻特征,腦海中是音還原說(shuō)否會(huì)自然浮現(xiàn)出對(duì)方的模樣
?波士頓大學(xué)的研究團(tuán)隊(duì)最近做了一件聽(tīng)起來(lái)像科幻小說(shuō)的事情:他們教會(huì)了人工智能僅僅通過(guò)聽(tīng)聲音,這就像是視覺(jué)我們?cè)诓恢榈那闆r下,
當(dāng)我們聽(tīng)到一個(gè)人說(shuō)話時(shí)