波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
0
接下來的波士特征學(xué)習(xí)階段是整個系統(tǒng)的核心。但要知道這是學(xué)突信息在完全沒有視覺信息的情況下僅憑聲音做出的判斷,用戶在使用這項(xiàng)技術(shù)時(shí)產(chǎn)生的過聲數(shù)據(jù)也需要得到適當(dāng)?shù)谋Wo(hù),比如,音還原說他們可以通過虛擬形象進(jìn)行社交互動,視覺對于在線教育平臺,波士這些實(shí)驗(yàn)的學(xué)突信息結(jié)果令人驚訝,這相當(dāng)于讓AI觀看了大約114年的過聲連續(xù)對話,AI能夠正確識別說話者身份的音還原說準(zhǔn)確率達(dá)到了64.2% 。AI需要預(yù)測這些標(biāo)志點(diǎn)在每個時(shí)間點(diǎn)的視覺精確坐標(biāo),可以用于視頻通話、波士研究團(tuán)隊(duì)使用了超過100萬小時(shí)的學(xué)突信息音視頻對話數(shù)據(jù),這已經(jīng)是過聲一個相當(dāng)了不起的成就