當(dāng)前位置:首頁>百科>>谷歌DeepMind團隊揭秘:AI如何像人類一樣掌握復(fù)雜推理技巧正文
Q&A
Q1:過程監(jiān)督強化學(xué)習(xí)與傳統(tǒng)AI訓(xùn)練方法有什么區(qū)別?握復(fù)
A :傳統(tǒng)AI訓(xùn)練只在任務(wù)結(jié)束后告訴AI答案對錯