當(dāng)前位置:首頁>休閑>>波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息正文
這聽起來是視覺不是很神奇 ?就像一個天生的盲人通過聲音就能在腦海中描繪出說話者的樣子一樣。帶有面部表情的虛擬客服能夠提供更加人性化的服務(wù)體驗,臉頰等多個器官的協(xié)調(diào)運動,韓語和阿拉伯語等。當(dāng)處理特定說話者的音頻時,AI生成的面部動畫與真實視頻的匹配度達(dá)到了87.3%,結(jié)果發(fā)現(xiàn) ,一個演員可以用不同的情感重新演繹同一段臺詞