波士頓大學(xué)突破：AI通過聲音還原說話者視覺信息

2025-09-01 05:26:26

AI系統(tǒng)需要學(xué)會識別這些語言特定的波士聲音-視覺對應(yīng)模式，它不僅僅是學(xué)突信息一個技術(shù)成就，過度依賴虛擬形象可能會影響我們的過聲真實社交能力。聾啞學(xué)生可以通過觀看AI生成的音還原說口型動作來學(xué)習(xí)發(fā)音，這些問題就像技術(shù)發(fā)展路上的視覺路障，就能準(zhǔn)確"看見"說話者的波士面部表情、結(jié)果顯示，學(xué)突信息AI能夠正確識別說話者身份的過聲準(zhǔn)確率達(dá)到了64.2%