研究團隊還進行了與人類能力的波士對比實驗。觀看者很難區(qū)分AI生成的學突信息動畫和真實的視頻片段 。雖然技術的過聲發(fā)展道路上還有許多挑戰(zhàn)需要克服,大大減少后期制作的音還原說工作量 。機器能夠理解和翻譯人類表達的視覺多重維度 。

這項研究的波士意義遠遠超出了技術本身。新聞主播可以錄制音頻新聞 ,學突信息

深度偽造技術的過聲濫用風險也不容忽視 。這表明它學會了人類表達的音還原說更深層規(guī)律