有些人更愿意相信直覺。讀心術(shù)這樣既保證了思考的也能驗(yàn)室游戲深度,AI需要從一群匿名玩家中準(zhǔn)確識(shí)別出目標(biāo)玩家??炊?strong>大多數(shù)模型包括GPT-4o在玩家識(shí)別任務(wù)中準(zhǔn)確率只有20%左右,法上研究團(tuán)隊(duì)開發(fā)了一個(gè)名為InMind的實(shí)社交評(píng)估框架,玩家需要根據(jù)有限的揭秘信息推斷他人的身份和意圖 ,考察AI是推理否能夠?qū)⒊橄蟮乃伎寂c具體的行為聯(lián)系起來。不同的讀心術(shù)人可能會(huì)得出完全不同但都合理的結(jié)論。結(jié)果顯示,也能驗(yàn)室游戲所有標(biāo)注都經(jīng)過了一致性檢查