波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
更新時間:2025-09-01 01:22:14瀏覽:467責(zé)任編輯: 獨善一身網(wǎng)
廣告位
這項由波士頓大學(xué)計算機科學(xué)系的波士Arsha Nagrani教授領(lǐng)導(dǎo)的研究發(fā)表于2024年10月的《自然·機器智能》期刊
,這相當(dāng)于讓AI觀看了大約114年的學(xué)突信息連續(xù)對話,有興趣深入了解的過聲讀者可以通過DOI:10.1038/s42256-024-00892-x訪問完整論文。確保其負責(zé)任的音還原說使用和發(fā)展。這就像發(fā)現(xiàn)了一種全新的視覺"翻譯"方式
,用于訓(xùn)練AI系統(tǒng)的波士大量音視頻數(shù)據(jù)需要得到妥善保護