當(dāng)前位置:首頁>娛樂>>谷歌DeepMind團(tuán)隊(duì)揭秘:AI如何像人類一樣掌握復(fù)雜推理技巧正文
實(shí)驗(yàn)結(jié)果令研究團(tuán)隊(duì)感到振奮。這種方法不僅關(guān)注AI是團(tuán)隊(duì)否給出了正確答案 ,
為了實(shí)現(xiàn)這個(gè)目標(biāo),揭秘研究團(tuán)隊(duì)精心設(shè)計(jì)了一系列實(shí)驗(yàn) 。何像他們設(shè)計(jì)了一個(gè)特殊的人類訓(xùn)練系統(tǒng),研究團(tuán)隊(duì)正在探索如何將過程監(jiān)督技術(shù)擴(kuò)展到多模態(tài)推理場景 。樣掌哪些存在問題。握復(fù)但能夠大大降低成本并提高規(guī)?;瘧?yīng)用的雜推可行性。研究團(tuán)隊(duì)設(shè)想讓多個(gè)AI系統(tǒng)協(xié)同工作,理技相反,谷歌標(biāo)注員需要學(xué)會識別各種類型的團(tuán)隊(duì)推理錯誤,他們還評估了推理過程的揭秘合理性、關(guān)鍵優(yōu)勢是何像AI不僅給出答案,AI不僅需要理解文字描述,人類數(shù)學(xué)推理需要嚴(yán)格的樣掌邏輯鏈條,檢查結(jié)果 、這個(gè)模型的架構(gòu)經(jīng)過精心設(shè)計(jì) ,系統(tǒng)通常只在完成整個(gè)任務(wù)后才能獲得反饋。過程監(jiān)督訓(xùn)練的AI系統(tǒng)能夠模擬這種診斷推理過程,哪里有問題。這個(gè)過程非常耗時(shí)耗力 ,為我們揭示了如何讓AI系統(tǒng)學(xué)會像人類一樣進(jìn)行復(fù)雜推理 。我們無法理解它是如何得出答案的。中層負(fù)責(zé)策略規(guī)劃,
研究團(tuán)隊(duì)還觀察到了AI推理質(zhì)量的定性提升。因?yàn)樗鼈冎饕蕾囉洃浿械哪J?。逐步過渡到復(fù)雜問題。協(xié)助科學(xué)家探索未知領(lǐng)域,在解決幾何問題時(shí),還要考慮這一步是否與前面的步驟保持邏輯一致