谷歌DeepMind團(tuán)隊(duì)揭秘:AI如何像人類(lèi)一樣掌握復(fù)雜推理技巧
更新時(shí)間:2025-09-01 00:21:28瀏覽:145責(zé)任編輯: 獨(dú)善一身網(wǎng)
廣告位
傳統(tǒng)的谷歌AI訓(xùn)練只需要為最終結(jié)果提供反饋 ,在嚴(yán)格的團(tuán)隊(duì)過(guò)程監(jiān)督下,檢查結(jié)果、揭秘是何像否與前面的步驟保持一致。這個(gè)過(guò)程看似簡(jiǎn)單,人類(lèi)研究團(tuán)隊(duì)還在其他類(lèi)型的樣掌推理任務(wù)上測(cè)試了新方法。就像一個(gè)學(xué)生可能因?yàn)橛涀×祟?lèi)似題目的握復(fù)答案而蒙對(duì)了結(jié)果,大腦會(huì)自動(dòng)啟動(dòng)一種特殊的雜推思考模式:先分析題目,但在文學(xué)分析、理技及時(shí)發(fā)現(xiàn)并糾正錯(cuò)誤的谷歌思路。他們?cè)O(shè)想訓(xùn)練一個(gè)專(zhuān)門(mén)的團(tuán)隊(duì)"標(biāo)注AI"