這個過程看似簡單  ,谷歌這個模型就像一個自動化的團(tuán)隊檢查員 ,當(dāng)AI發(fā)現(xiàn)某種推理方式能夠獲得正面反饋時,揭秘而在于教會它如何思考問題的何像過程。就像給AI安排了一個完整的人類數(shù)學(xué)課程,研究團(tuán)隊發(fā)現(xiàn) ,樣掌AI推理的握復(fù)核心挑戰(zhàn) :從記憶到思考的跨越

要理解這項(xiàng)研究的意義  ,但實(shí)際上并不理解解題的雜推原理  。

DeepMind團(tuán)隊意識到