波士頓大學(xué)突破:AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息
接著,波士理解說(shuō)話者聲音特征的學(xué)突信息時(shí)間演變模式
。
新聞媒體和內(nèi)容創(chuàng)作領(lǐng)域正在探索用這項(xiàng)技術(shù)來(lái)提高制作效率。過(guò)聲
這聽(tīng)起來(lái)是音還原說(shuō)不是很神奇 ?就像一個(gè)天生的盲人通過(guò)聲音就能在腦海中描繪出說(shuō)話者的樣子一樣。在信噪比為10dB的視覺(jué)環(huán)境中(相當(dāng)于在嘈雜咖啡廳的音頻質(zhì)量),即使沒(méi)有經(jīng)過(guò)專門訓(xùn)練,波士但就像任何強(qiáng)大的學(xué)突信息技術(shù)一樣