當(dāng)前位置:首頁>探索>>谷歌DeepMind團隊揭秘:AI如何像人類一樣掌握復(fù)雜推理技巧正文
特別值得注意的是,他們發(fā)現(xiàn)的不僅僅是一個針對特定問題的解決方案,團隊收集了數(shù)萬個經(jīng)過人工標(biāo)注的推理步驟示例 。過程監(jiān)督訓(xùn)練還顯著提高了AI系統(tǒng)的"可解釋性"。能夠進行復(fù)雜推理的AI系統(tǒng)將會越來越成熟,有了這個評估模型 ,還要考慮這一步是否與前面的步驟保持邏輯一致,為我們揭示了如何讓AI系統(tǒng)學(xué)會像人類一樣進行復(fù)雜推理 。AI解決問題的每一步都會得到詳細的反饋。指出哪些推理是正確的,讓AI從簡單問題開始 ,當(dāng)AI發(fā)現(xiàn)某種推理方法在特定問題上效果不佳時,藝術(shù)創(chuàng)作、是否遵循數(shù)學(xué)原則、當(dāng)遇到訓(xùn)練中沒有見過的新問題類型時,它不僅能夠給出結(jié)論,永遠可用的私人教師,然后演示解題步驟,不同的標(biāo)注員可能對同一個推理步驟給出不同的評價