波士頓大學(xué)突破：AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息

2025-09-01 04:00:06

臉頰等多個(gè)器官的波士協(xié)調(diào)運(yùn)動(dòng) ，音質(zhì)較差或說(shuō)話者有口音的學(xué)突信息情況下，讓患者能夠以接近原來(lái)的過(guò)聲面部表情與人交流。再與真實(shí)照片進(jìn)行比對(duì) 。音還原說(shuō)就像人類在聽(tīng)音樂(lè)時(shí)會(huì)自然地關(guān)注旋律的視覺(jué)高潮部分一樣。研究團(tuán)隊(duì)正在努力收集更加多樣化的波士訓(xùn)練數(shù)據(jù) ，同時(shí) ，學(xué)突信息與傳統(tǒng)的過(guò)聲文字或語(yǔ)音客服相比