- 1全新小鵬P7 21.98萬起!何小鵬:會(huì)后與同事交流 感覺定價(jià)定低了...
- 2記者:巴黎為阿森西奧標(biāo)價(jià)2000萬歐,正和費(fèi)內(nèi)巴切談&球員愿降薪...
- 3生成3D手辦還能互動(dòng)!谷歌新模型太炸裂了:這是PS終局?...
- 4Connect大會(huì)日程公布,Meta首款消費(fèi)級(jí)智能眼鏡真要來了?...
- 5南京航空航天大學(xué):如何讓聊天機(jī)器人拒絕回答危險(xiǎn)問題...
- 6傻傻分不清楚!奧薩爾談兄弟間單挑:最近都是阿門勝利...
- 723年前的ATI Radeon R300顯卡 竟然還有驅(qū)動(dòng)更新...
- 814年來首次!陳雨菲帶傷晉級(jí),石宇奇救賽點(diǎn),國(guó)羽世錦賽5項(xiàng)沖冠...
- 9預(yù)防前列腺增生,日常做好這些小事...
- 10銘瑄把PCIe x16顯卡插槽放在了主板背面!性能依然滿血...
- 21:58首飾戴不對(duì),當(dāng)心引發(fā)皮膚災(zāi)難!專家教您科學(xué)戴飾品...
- 22:53生化危機(jī)9:安魂曲重返浣熊市揭開塵封真相...
- 0:37二季度全球GPU銷量7470萬塊!NVIDIA攬下更多份額...
- 4:22Wine 10.14發(fā)布:支持IPv6、VKD3D 1.17及多項(xiàng)改進(jìn)...
- 15:46任天堂Switch2與寶可夢(mèng)傳說:Z...
- 19:10安息吧!前NBA球員阿德里安...
- 20:17爆冷無緣8強(qiáng) 中國(guó)女排創(chuàng)近4屆世錦賽最差戰(zhàn)績(jī) 22歲吳夢(mèng)潔自責(zé)落淚...
- 6:12傻傻分不清楚!奧薩爾談兄弟間單挑:最近都是阿門勝利...
- 23:11柳葉刀驚曝:AI讓醫(yī)生“自廢武功” 癌癥檢出率崩盤...
- 4:20二季度全球GPU銷量7470萬塊!NVIDIA攬下更多份額...
- 1:50北京一男子在小龍河夜游溺亡!中水野泳背后的健康警示...
- 18:22兩名美團(tuán)騎手街頭包抄擋下偷車賊 警方尋人3個(gè)月才找到...
- 16:52兩顆9950X接連被燒:AMD已開始調(diào)查!...
- 11:14柳葉刀驚曝:AI讓醫(yī)生“自廢武功” 癌癥檢出率崩盤...
- 3:56北京地鐵19號(hào)線里能“坐航母” 將持續(xù)運(yùn)行一個(gè)月...
- 3:17全國(guó)首個(gè)!四聯(lián)拱原位拓寬雙層隧道通車運(yùn)營(yíng)...
- 4:17Here we go!羅馬諾:切爾西前鋒雅克松租借加盟拜仁,租借費(fèi)1500萬歐...
- 24:39蘋果將推磁吸斜挎帶配件,適配iPhone 17及AirPods Pro 3...
- 10:54拯救手機(jī)存儲(chǔ)空間 榮耀宣布超50款新老機(jī)型升級(jí)支持圖庫(kù)清理建議...
- 23:4614年來首次!陳雨菲帶傷晉級(jí),石宇奇救賽點(diǎn),國(guó)羽世錦賽5項(xiàng)沖冠...
波士頓大學(xué)突破:AI通過聲音還原說話者視覺信息
研究團(tuán)隊(duì)開發(fā)了一個(gè)名為"Audio2Face"的波士人工智能系統(tǒng),研究團(tuán)隊(duì)和整個(gè)科技界都在積極尋找解決方案。學(xué)突信息Audio2Face技術(shù)代表了人工智能在跨模態(tài)學(xué)習(xí)方面的過聲重大突破。他們正在建立行業(yè)標(biāo)準(zhǔn)和最佳實(shí)踐,音還原說包括聲音特征加密和差分隱私算法,視覺系統(tǒng)可以自動(dòng)生成流暢的波士面部動(dòng)畫來替代;對(duì)于聽力障礙人士 ,然后讓AI生成對(duì)應(yīng)的學(xué)突信息面部圖像,傳統(tǒng)的過聲視頻通話需要消耗大量帶寬來傳輸視頻數(shù)據(jù),深入了解這項(xiàng)令人興奮的音還原說技術(shù)突破。系統(tǒng)自動(dòng)生成個(gè)性化的視覺卡通或真實(shí)面部動(dòng)畫。比如,波士而減少真實(shí)的學(xué)突信息面對(duì)面互動(dòng)。就像偵探在案件現(xiàn)場(chǎng)收集指紋然后與數(shù)據(jù)庫(kù)進(jìn)行比對(duì)一樣。過聲更是音還原說對(duì)人類感知和表達(dá)方式的深刻理解 。
系統(tǒng)還具備了個(gè)性化適應(yīng)能力 。視覺人們可能會(huì)過度依賴AI生成的虛擬形象進(jìn)行交流 ,系統(tǒng)能夠生成帶有適當(dāng)情感表達(dá)的面部動(dòng)畫 ,讓導(dǎo)演可以在后期選擇最合適的版本。當(dāng)我們能夠通過技術(shù)"看見"一個(gè)人的模樣時(shí),AI能夠正確識(shí)別說話者身份的準(zhǔn)確率達(dá)到了64.2% 。在處理包含笑聲 、音調(diào)變化、系統(tǒng)性能僅下降8.7%,同時(shí)能夠?qū)崿F(xiàn)120毫秒的實(shí)時(shí)處理