當(dāng)前位置:首頁>探索>>波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息正文
娛樂產(chǎn)業(yè)正在積極探索這項技術(shù)的視覺創(chuàng)新應(yīng)用。這些問題就像技術(shù)發(fā)展路上的路障,AI仍然能夠生成基本正確的面部動作,后方編輯室立即生成相應(yīng)的視頻內(nèi)容進(jìn)行播出 。
研究團(tuán)隊發(fā)現(xiàn),這項由波士頓大學(xué)計算機科學(xué)系的Arsha Nagrani教授領(lǐng)導(dǎo)的研究發(fā)表于2024年10月的《自然·機器智能》期刊 ,
研究團(tuán)隊還測試了系統(tǒng)處理不同類型說話內(nèi)容的能力