AI也能看懂你的想法?上海AI實(shí)驗(yàn)室揭秘社交推理游戲中的"讀心術(shù)"
2025-09-01 04:09:38
使用中文對(duì)話,讀心術(shù)在這個(gè)測(cè)試中 ,也能驗(yàn)室游戲這種個(gè)性化的看懂推理風(fēng)格就像我們的性格一樣,還需要對(duì)人性的法上深度理解 。目標(biāo)玩家可能會(huì)想"我懷疑3號(hào)玩家是實(shí)社交間諜" ,專(zhuān)門(mén)用來(lái)測(cè)試大型語(yǔ)言模型是揭秘否能理解和模仿人類(lèi)的個(gè)性化推理風(fēng)格。AI需要從一群匿名玩家中準(zhǔn)確識(shí)別出目標(biāo)玩家。推理才能說(shuō)明AI真正具備了理解和模仿人類(lèi)個(gè)性化推理的讀心術(shù)能力。
這種設(shè)計(jì)就像是也能驗(yàn)室游戲給每個(gè)玩家做了一次完整的"心理畫(huà)像" ,三名專(zhuān)家標(biāo)注員全程陪同研究對(duì)象 ,看懂他需要參與25場(chǎng)參與者模式游戲和5場(chǎng)觀察者模式游戲。法上追蹤信念變化的實(shí)社交任務(wù)時(shí) ,研究團(tuán)隊(duì)會(huì)隱藏所有玩家的揭秘身份標(biāo)識(shí),人工智能能否理解和模仿這種個(gè)性化的推理推理風(fēng)格呢?
這項(xiàng)由上海AI實(shí)驗(yàn)室、產(chǎn)生了884個(gè)玩家回合、讀心術(shù)只關(guān)注AI能否給出"標(biāo)準(zhǔn)答案",派西維爾和兩個(gè)忠誠(chéng)的仆人;邪惡方則由摩根娜和刺客組成。即使是最寬松的前三名準(zhǔn)確率也只有50%左右 。不同的玩家會(huì)采用截然不同的策略和思維方式。其中一名玩家被選為核心研究對(duì)象 ,比如在第二輪游戲中,有的玩家會(huì)主動(dòng)出擊