這種提升不是谷歌通過增加模型規(guī)模或訓練數(shù)據(jù)量實現(xiàn)的 ,但經(jīng)過過程監(jiān)督訓練的團隊AI系統(tǒng)會清晰地展示自己的推理步驟