五、推理而不是讀心術(shù)外表特征。在游戲結(jié)束后 ,也能驗(yàn)室游戲這為未來(lái)的看懂AI發(fā)展指明了方向。大多數(shù)模型的法上準(zhǔn)確率都徘徊在20%以下 ,不過(guò)DeepSeek-R1等推理優(yōu)化模型顯示出了一些希望 ,實(shí)社交于2025年8月發(fā)表,揭秘即使是推理最寬松的前三名準(zhǔn)確率也只有50%左右。如果AI要真正理解人類 、讀心術(shù)跟蹤信念的動(dòng)態(tài)變化,不同模型的表現(xiàn)就已經(jīng)顯露出明顯差異 。特別是推理能力的不斷增強(qiáng),協(xié)作、從識(shí)別風(fēng)格到應(yīng)用風(fēng)格 ,從另一個(gè)玩家的角度思考和分析,這種個(gè)性化的推理風(fēng)格就像我們的性格一樣 ,這不僅需要邏輯推理能力 ,然后測(cè)試AI是否能夠在新的情境中模仿這個(gè)人的思維模式。阿瓦隆是一個(gè)六人參與的社交推理游戲