波士頓大學突破：AI通過聲音還原說話者視覺信息

2025-09-01 03:53:25

這些特征反映了說話時舌頭、波士這些信息足以讓機器重建出說話者的學突信息外貌。研究團隊使用了超過100萬小時的過聲音視頻對話數(shù)據(jù)，就像學會了聲音和視覺之間的音還原說"翻譯"規(guī)則，從音頻信號中捕捉到我們平時根本注意不到的視覺細微線索