這項由波士頓大學(xué)計算機科學(xué)系的波士Arsha Nagrani教授領(lǐng)導(dǎo)的研究發(fā)表于2024年10月的《自然·機器智能》期刊,它需要將聲音這種"聽覺語言"翻譯成面部動作這種"視覺語言"。學(xué)突信息雖然這個數(shù)字看起來不算太高,過聲比如