谷歌DeepMind團隊揭秘:AI如何像人類一樣掌握復(fù)雜推理技巧
時間:2025-09-01 06:17:46 來源:網(wǎng)絡(luò)
目前的谷歌研究主要集中在數(shù)學(xué)推理這個相對規(guī)范的領(lǐng)域,使用過程監(jiān)督強化學(xué)習(xí)訓(xùn)練的團隊AI系統(tǒng)將準確率從原來的41%提升到了73% ,研究者們找到了提升AI推理能力的揭秘新路徑。研究人員必須仔細審查AI生成的何像每一個推理步驟,這是人類一個質(zhì)的飛躍 。讓它從基礎(chǔ)知識開始逐步掌握復(fù)雜的樣掌推理技巧。然后選擇最優(yōu)的握復(fù)一步