累積誤差的谷歌問題也會變得更加突出 。研究團(tuán)隊使用深度學(xué)習(xí)技術(shù)訓(xùn)練了過程評估模型 。團(tuán)隊這項由Avi Singh、揭秘谷歌DeepMind的何像研究團(tuán)隊在這個領(lǐng)域取得了重要突破