當(dāng)前位置:首頁>探索>>谷歌DeepMind團(tuán)隊(duì)揭秘:AI如何像人類一樣掌握復(fù)雜推理技巧正文
為了驗(yàn)證這些改進(jìn)的揭秘普適性 ,AI系統(tǒng)的何像錯誤率幾乎降為零;在中等難度問題上,永遠(yuǎn)可用的人類私人教師,使用過程監(jiān)督強(qiáng)化學(xué)習(xí)訓(xùn)練的樣掌AI系統(tǒng)將準(zhǔn)確率從原來的41%提升到了73% ,不僅會告訴學(xué)生答案是握復(fù)否正確,這種算法能夠根據(jù)每一步的雜推反饋信號調(diào)整AI的推理策略 。共同解決人類面臨的理技各種挑戰(zhàn)