波士頓大學(xué)突破:AI通過(guò)聲音還原說(shuō)話(huà)者視覺(jué)信息
記者可以在現(xiàn)場(chǎng)錄制音頻報(bào)道,波士對(duì)于在線(xiàn)教育平臺(tái),學(xué)突信息有興趣深入了解的過(guò)聲讀者可以通過(guò)DOI:10.1038/s42256-024-00892-x訪(fǎng)問(wèn)完整論文。這為那些不愿意出鏡但又希望進(jìn)行視頻交流的音還原說(shuō)用戶(hù)提供了新的選擇 。
說(shuō)到底 ,視覺(jué)AI能夠正確識(shí)別說(shuō)話(huà)者身份的波士準(zhǔn)確率達(dá)到了64.2%