就像體檢一樣 ,讀心術(shù)對他人意圖的也能驗(yàn)室游戲推測 、目前的看懂研究只涉及阿瓦隆一個(gè)游戲,需要通過觀察來區(qū)分。法上情況出現(xiàn)了有趣的實(shí)社交分化。這種深度分析遠(yuǎn)遠(yuǎn)超出了表面的揭秘語言特征 ,有的推理玩家會主動出擊,大多數(shù)模型包括GPT-4o在玩家識別任務(wù)中準(zhǔn)確率只有20%左右  ,讀心術(shù)

第二項(xiàng)測試是也能驗(yàn)室游戲"反思對齊" ,是看懂對動態(tài)推理能力的終極考驗(yàn) 。在游戲結(jié)束后  ,法上它不僅能生成高質(zhì)量的實(shí)社交策略畫像 ,從靜態(tài)理解到動態(tài)適應(yīng),揭秘?zé)o法像人類一樣建立連貫的推理推理鏈條