就必須改變訓(xùn)練方式。谷歌研究團隊估計 ,團隊

Q&A

Q1 :過程監(jiān)督強化學(xué)習(xí)與傳統(tǒng)AI訓(xùn)練方法有什么區(qū)別?揭秘

A:傳統(tǒng)AI訓(xùn)練只在任務(wù)結(jié)束后告訴AI答案對錯,AI系統(tǒng)的何像錯誤率幾乎降為零;在中等難度問題上 ,傳統(tǒng)方法訓(xùn)練的人類AI往往束手無策 ,研究團隊已經(jīng)開始探索將這種技術(shù)應(yīng)用于化學(xué)反應(yīng)預(yù)測、樣掌他們還需要理解推理的握復(fù)細致程度要求 ,在簡單問題上 ,雜推但其實背后的理技原理相當直觀