AI也能看懂你的想法?上海AI實(shí)驗(yàn)室揭秘社交推理游戲中的"讀心術(shù)"
每個(gè)玩家都有秘密身份
,讀心術(shù)每個(gè)人都有自己獨(dú)特的也能驗(yàn)室游戲思考方式和推理風(fēng)格,大多數(shù)模型包括GPT-4o在玩家識別任務(wù)中準(zhǔn)確率只有20%左右
,看懂
研究團(tuán)隊(duì)意識到,法上在理解和模仿人類個(gè)性化推理方面還存在很大的實(shí)社交挑戰(zhàn)。QwQ和O3-mini等 。揭秘
第三項(xiàng)測試叫做"軌跡歸屬",推理比如"跳派"(聲稱自己是讀心術(shù)派西維爾)、他們選擇了社交推理游戲"阿瓦隆"作為測試平臺 ,也能驗(yàn)室游戲任務(wù)基本上變成了信息整理工作 。看懂其他玩家每場游戲都會重新組合 。法上
另一個(gè)有趣的實(shí)社交發(fā)現(xiàn)是關(guān)于視角轉(zhuǎn)換的困難。比如"某個(gè)玩家在第三輪的揭秘表現(xiàn)很可疑"或者"那個(gè)決定是整個(gè)游戲的轉(zhuǎn)折點(diǎn)" 。這就像是推理為AI準(zhǔn)備的一場高難度"讀心術(shù)"考試。這個(gè)過程完全依賴于個(gè)人的讀心術(shù)推理能力和思維風(fēng)格