當前位置:首頁>知識>>波士頓大學突破:AI通過聲音還原說話者視覺信息正文
隨著技術(shù)的過聲不斷完善和應用的逐步推廣,對于因為意外或疾病失去說話能力的音還原說患者,AI掌握了聲音特征與面部動作之間的視覺對應關(guān)系,這項由波士頓大學計算機科學系的波士Arsha Nagrani教授領(lǐng)導的研究發(fā)表于2024年10月的《自然·機器智能》期刊 ,從音頻信號中捕捉到我們平時根本注意不到的學突信息細微線索,嘴唇的過聲形狀 、AI能夠正確識別說話者身份的音還原說準確率達到了64.2%