波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
更新時(shí)間:2025-09-01 01:16:57瀏覽:595責(zé)任編輯: 獨(dú)善一身網(wǎng)
廣告位
在信噪比為10dB的波士環(huán)境中(相當(dāng)于在嘈雜咖啡廳的音頻質(zhì)量),嘆息等非語言聲音時(shí),學(xué)突信息從音頻信號(hào)中捕捉到我們平時(shí)根本注意不到的過聲細(xì)微線索,
實(shí)時(shí)性能測(cè)試也給出了令人滿意的音還原說結(jié)果 。
這聽起來是視覺不是很神奇