當(dāng)前位置:首頁>綜合>>谷歌DeepMind團(tuán)隊(duì)揭秘:AI如何像人類一樣掌握復(fù)雜推理技巧正文
Q&A
Q1:過程監(jiān)督強(qiáng)化學(xué)習(xí)與傳統(tǒng)AI訓(xùn)練方法有什么區(qū)別?谷歌
A:傳統(tǒng)AI訓(xùn)練只在任務(wù)結(jié)束后告訴AI答案對錯(cuò)