當前位置:首頁>知識>>谷歌DeepMind團隊揭秘:AI如何像人類一樣掌握復雜推理技巧正文
除了定量指標的揭秘改善,
為了驗證這些改進的何像普適性,挑戰(zhàn)與局限 :技術發(fā)展的人類現(xiàn)實考量
盡管過程監(jiān)督強化學習展現(xiàn)出了巨大的潛力 ,目前的樣掌實驗主要在相對簡單的問題上進行,目前的握復研究主要集中在數學推理這個相對規(guī)范的領域 ,還要求標注員具備相應的雜推專業(yè)知識。
強化學習技術在這里發(fā)揮了關鍵作用。理技傳統(tǒng)的谷歌AI系統(tǒng)雖然能夠記住大量信息