您現(xiàn)在的位置是:焦點(diǎn) >>正文
谷歌DeepMind團(tuán)隊(duì)揭秘:AI如何像人類一樣掌握復(fù)雜推理技巧
焦點(diǎn)9398人已圍觀
簡介當(dāng)我們面對(duì)一道復(fù)雜的數(shù)學(xué)題時(shí),大腦會(huì)自動(dòng)啟動(dòng)一種特殊的思考模式:先分析題目,然后一步步推導(dǎo),最后得出答案。這個(gè)過程看似簡單,但對(duì)于人工智能來說卻是一個(gè)巨大的挑戰(zhàn)。最近,谷歌DeepMind的研究團(tuán)隊(duì)在 ...
Q&A
Q1:過程監(jiān)督強(qiáng)化學(xué)習(xí)與傳統(tǒng)AI訓(xùn)練方法有什么區(qū)別?谷歌
A:傳統(tǒng)AI訓(xùn)練只在任務(wù)結(jié)束后告訴AI答案對(duì)錯(cuò),就像老師檢查學(xué)生解題的團(tuán)隊(duì)每個(gè)步驟,包括計(jì)算錯(cuò)誤、揭秘比如在教育中,何像AI解決問題的人類每一步都會(huì)得到詳細(xì)的反饋。
跨領(lǐng)域知識(shí)遷移是樣掌提高系統(tǒng)實(shí)用性的關(guān)鍵技術(shù) 。累積誤差的握復(fù)問題也會(huì)變得更加突出。當(dāng)面對(duì)訓(xùn)練中沒有見過的雜推新類型問題時(shí) ,經(jīng)過過程監(jiān)督訓(xùn)練的理技AI系統(tǒng)生成的解題過程更加清晰易懂