研究團隊使用了超過100萬小時的波士音視頻對話數(shù)據(jù) ,系統(tǒng)自動生成個性化的學(xué)突信息卡通或真實面部動畫 。同時能夠?qū)崿F(xiàn)120毫秒的過聲實時處理