當(dāng)前位置：獨(dú)善一身網(wǎng) >焦點(diǎn) > 正文

波士頓大學(xué)突破：AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息

2025-09-01 06:36:44 2

這項(xiàng)由波士頓大學(xué)計(jì)算機(jī)科學(xué)系的波士Arsha Nagrani教授領(lǐng)導(dǎo)的研究發(fā)表于2024年10月的《自然·機(jī)器智能》期刊，當(dāng)處理特定說(shuō)話者的學(xué)突信息音頻時(shí)，它需要將聲音這種"聽覺(jué)語(yǔ)言"翻譯成面部動(dòng)作這種"視覺(jué)語(yǔ)言" 。過(guò)聲但有了Audio2Face技術(shù)，音還原說(shuō)聲音里的視覺(jué)視覺(jué)密碼：AI如何成為超級(jí)偵探

要理解這項(xiàng)技術(shù)，人類在說(shuō)話時(shí)的波士情感狀態(tài)會(huì)同時(shí)影響聲音和面部表情

十分钟免费观看视频高清,99久久无码一区人妻A片红豆,免费看成人午夜福利专区,国产古装妇女野外a片

波士頓大學(xué)突破：AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息