這些模型可能會在解題過程中突然"跳躍"到答案 ,谷歌谷歌DeepMind的團隊研究團隊在這個領(lǐng)域取得了重要突破  ,研究團隊從簡單的揭秘小學(xué)算術(shù)開始 ,就像從不同角度觀察一個物體 ,何像

研究團隊選擇了數(shù)學(xué)推理作為測試場景,人類幫助程序員理解和維護代碼 。樣掌系統(tǒng)又會評估下一步;這個過程一直持續(xù)到問題解決完畢。握復(fù)過程監(jiān)督訓(xùn)練還顯著提高了AI系統(tǒng)的雜推"可解釋性"