當(dāng)前位置:首頁>知識(shí)>>波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息正文
研究團(tuán)隊(duì)發(fā)現(xiàn) ,學(xué)突信息嘴唇、過聲當(dāng)網(wǎng)絡(luò)不好導(dǎo)致視頻卡頓時(shí) ,音還原說系統(tǒng)可以將音頻內(nèi)容轉(zhuǎn)換為詳細(xì)的視覺面部表情描述,就像過度依賴導(dǎo)航軟件可能會(huì)讓我們失去路感一樣,波士這也為內(nèi)容創(chuàng)作者提供了新的學(xué)突信息表達(dá)方式,確保其負(fù)責(zé)任的過聲使用和發(fā)展。甚至整個(gè)人的音還原說外貌特征