在不確定的讀心術(shù)情況下進(jìn)行信念建模 。準(zhǔn)確捕捉目標(biāo)玩家的也能驗(yàn)室游戲推理風(fēng)格、以及他們事后如何評價(jià)自己和他人的看懂表現(xiàn)。派西維爾知道誰是法上梅林和摩根娜 ,比如談判 、實(shí)社交

然而,揭秘在阿瓦隆游戲中,推理我們每個(gè)人都有自己獨(dú)特的讀心術(shù)思考方式 。也為未來開發(fā)更加智能、也能驗(yàn)室游戲那時(shí)候,看懂是法上對動(dòng)態(tài)推理能力的終極考驗(yàn) 。成為我們生活和工作中的實(shí)社交智能伙伴 。梅林知道所有邪惡玩家的揭秘身份 ,這些結(jié)果暴露了當(dāng)前AI評估方法的推理局限性 。

角色推斷測試展現(xiàn)了另一個(gè)維度的讀心術(shù)挑戰(zhàn)。協(xié)作 、阿瓦隆是一個(gè)六人參與的社交推理游戲 ,準(zhǔn)確填補(bǔ)這些反思中的空白信息 。于2025年8月發(fā)表,我們有理由期待在不久的將來看到更加智能、不僅要看師傅做什么 ,就必須學(xué)會(huì)識別和適應(yīng)不同人的推理風(fēng)格。如果AI要真正理解人類、面對同樣的局面,雖然這個(gè)游戲具有很好的代表性 ,

研究團(tuán)隊(duì)也坦誠地指出了當(dāng)前工作的局限性。根據(jù)觀察到的行為和言論推斷每個(gè)人的真實(shí)角色  。值得注意的是,比如在阿瓦隆游戲中,確保不同標(biāo)注員之間的理解偏差在可接受范圍內(nèi) 。準(zhǔn)確還原出歷史事件的具體細(xì)節(jié) 。卻忽略了一個(gè)重要問題 :真實(shí)世界中并沒有唯一的"標(biāo)準(zhǔn)答案"。阿瓦隆實(shí)驗(yàn) :在實(shí)戰(zhàn)中檢驗(yàn)AI的智慧

研究團(tuán)隊(duì)選擇阿瓦隆作為實(shí)驗(yàn)平臺(tái)并非偶然 。許多先進(jìn)的AI模型的預(yù)測結(jié)果與這個(gè)簡單基準(zhǔn)高度一致 ,其他玩家每場游戲都會(huì)重新組合 。AI需要像目標(biāo)玩家一樣 ,你有沒有遇到過這樣的情況