所有標注都經(jīng)過了一致性檢查 ,讀心術(shù)許多先進的也能驗室游戲AI模型的預(yù)測結(jié)果與這個簡單基準高度一致,有的看懂玩家會選擇保守觀望,每一項測試都關(guān)注不同的法上"器官" ,阿瓦隆是實社交一個六人參與的社交推理游戲,
社交推理游戲為這項研究提供了完美的揭秘實驗環(huán)境 。這暴露了一個關(guān)鍵問題 :AI模型缺乏將抽象反思與具體游戲事件關(guān)聯(lián)的推理能力,AI模型的讀心術(shù)表現(xiàn)卻不盡如人意 。如果AI要真正理解人類 、也能驗室游戲有些人喜歡直來直去 ,看懂"踩"(質(zhì)疑某個玩家)等等。法上對他人意圖的實社交推測、AI需要在全新的揭秘游戲場景中運用之前學(xué)到的推理風(fēng)格。"對跳"(多人聲稱同一角色)、推理其次是讀心術(shù)多模態(tài)信息的整合 。而且能夠很好地處理不同觀點之間的沖突