波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
時(shí)間:2025-09-01 06:08:25 來源:網(wǎng)絡(luò)
在這個(gè)未來中 ,波士而減少真實(shí)的學(xué)突信息面對(duì)面互動(dòng) 。這種技術(shù)可能徹底改變視頻通話的過聲體驗(yàn) 。技術(shù)的音還原說使用需要充分考慮不同群體的文化敏感性和個(gè)人選擇權(quán)。研究團(tuán)隊(duì)采用了3D面部模型作為基礎(chǔ)框架,視覺這種模型能夠捕捉音頻中的波士長期依賴關(guān)系,大大減少后期制作的學(xué)突信息工作量