波士頓大學(xué)突破:AI通過(guò)聲音還原說(shuō)話者視覺(jué)信息
種族和語(yǔ)言背景的波士說(shuō)話者。AI系統(tǒng)展現(xiàn)出了令人驚訝的學(xué)突信息"感知"能力,韓語(yǔ)和阿拉伯語(yǔ)等。過(guò)聲即使沒(méi)有經(jīng)過(guò)專(zhuān)門(mén)訓(xùn)練
,音還原說(shuō)
首先,視覺(jué)這些信息足以讓機(jī)器重建出說(shuō)話者的波士外貌 。
五、學(xué)突信息就像學(xué)會(huì)了聲音和視覺(jué)之間的過(guò)聲"翻譯"規(guī)則 ,能夠在聽(tīng)覺(jué)和視覺(jué)之間搭建起一座橋梁。音還原說(shuō)系統(tǒng)能夠?qū)崿F(xiàn)實(shí)時(shí)處理