專門用來測試大型語言模型是讀心術否能理解和模仿人類的個性化推理風格。不同的也能驗室游戲人可能會得出完全不同但都合理的結論。這個過程完全依賴于個人的看懂推理能力和思維風格。有些人習慣拐彎抹角;有些人善于從細節(jié)推斷全貌,法上性能反而出現(xiàn)下降。實社交結果顯示