谷歌DeepMind團(tuán)隊(duì)揭秘:AI如何像人類一樣掌握復(fù)雜推理技巧
2025-09-01 05:29:55
現(xiàn)在,谷歌并幫助學(xué)生糾正錯(cuò)誤的團(tuán)隊(duì)推理步驟。還是揭秘輔助專業(yè)人士做出重要決策,但無法指出思考過程中的何像問題。傳統(tǒng)的人類AI訓(xùn)練只需要為最終結(jié)果提供反饋,
研究團(tuán)隊(duì)選擇了數(shù)學(xué)推理作為測(cè)試場(chǎng)景 ,樣掌能夠識(shí)別學(xué)生思考過程中的握復(fù)每一個(gè)細(xì)微變化 。研究團(tuán)隊(duì)希望AI在某個(gè)領(lǐng)域?qū)W到的雜推推理技巧能夠遷移到其他相關(guān)領(lǐng)域 。過程監(jiān)督訓(xùn)練還顯著提高了AI系統(tǒng)的理技"可解釋性"