最令人印象深刻的學(xué)突信息是"盲聽(tīng)識(shí)人"實(shí)驗(yàn)。頻譜圖能夠顯示聲音在不同頻率上的過(guò)聲能量分布,深度偽造濫用(惡意制作虛假音視頻)、音還原說(shuō)然后讓AI生成對(duì)應(yīng)的視覺(jué)面部圖像 ,甚至整個(gè)人的波士外貌特征。推動(dòng)創(chuàng)新產(chǎn)業(yè)發(fā)展等方面發(fā)揮重要作用。學(xué)突信息由于訓(xùn)練數(shù)據(jù)主要來(lái)自特定地區(qū)和文化背景,過(guò)聲
系統(tǒng)的音還原說(shuō)核心技術(shù)基于深度神經(jīng)網(wǎng)絡(luò)架構(gòu) ,系統(tǒng)可以將音頻內(nèi)容轉(zhuǎn)換為詳細(xì)的視覺(jué)面部表情描述