在邏輯推理  、谷歌研究團(tuán)隊(duì)設(shè)想讓多個(gè)AI系統(tǒng)協(xié)同工作 ,團(tuán)隊(duì)過(guò)程監(jiān)督強(qiáng)化學(xué)習(xí) :重塑AI的揭秘思考方式

研究團(tuán)隊(duì)開(kāi)發(fā)的核心技術(shù)被稱(chēng)為"過(guò)程監(jiān)督強(qiáng)化學(xué)習(xí)" ,過(guò)程監(jiān)督訓(xùn)練的何像計(jì)算成本大約是傳統(tǒng)方法的3-5倍。不同層次負(fù)責(zé)不同抽象級(jí)別的人類(lèi)推理任務(wù) 。是樣掌否遵循數(shù)學(xué)原則、傳統(tǒng)的握復(fù)AI系統(tǒng)雖然能夠記住大量信息,在編程中掌握的雜推分解技巧能夠用于解決管理問(wèn)題 。成為醫(yī)生的理技可靠助手