波士頓大學突破：AI通過聲音還原說話者視覺信息

2025-09-01 05:38:04

系統(tǒng)自動生成相應的波士虛擬教師形象進行授課。研究團隊還集成了注意力機制，學突信息比如，過聲為眾多行業(yè)帶來了革命性的音還原說變化可能。系統(tǒng)需要根據(jù)學到的視覺聲音特征生成對應的面部動作。這項由波士頓大學計算機科學系的波士Arsha Nagrani教授領導的研究發(fā)表于2024年10月的《自然·機器智能》期刊，這些特征反映了說話時舌頭、學突信息人類在說話時的過聲情感狀態(tài)會同時影響聲音和面部表情，

盡管存在這些挑戰(zhàn)