最顯著的谷歌挑戰(zhàn)是計算成本的大幅增加 。這些標注員會仔細檢查AI生成的團隊每一個推理步驟。他們使用了課程學習的揭秘策略,這個選擇并非偶然 。何像研究團隊訓練了一個專門的人類"過程評估模型"。目前的樣掌實驗主要在相對簡單的問題上進行 ,通過關注AI的握復思考過程而不僅僅是最終結果 ,以及如何擴展到更主觀的雜推領域。但研究團隊也清醒地認識到這項技術面臨的理技挑戰(zhàn)和局限