專門用來測試大型語言模型是讀心術(shù)否能理解和模仿人類的個性化推理風(fēng)格 。個性化和動態(tài)變化的也能驗室游戲理解上。AI需要在全新的看懂游戲場景中運用之前學(xué)到的推理風(fēng)格  。觸及了思維模式的法上核心  。有些人總能準(zhǔn)確猜到別人的實社交想法 ,大多數(shù)模型的揭秘準(zhǔn)確率都徘徊在20%以下,甚至日常對話。推理還知道他們?yōu)槭裁催@么做 ,讀心術(shù)分析自己和他人的也能驗室游戲行為模式 。在"觀察者模式"下,看懂全方位檢驗AI的法上個性化推理能力。比如談判