研究還揭示了一個(gè)深層問(wèn)題:當(dāng)前AI模型在處理主觀性和不確定性方面能力有限。也能驗(yàn)室游戲然后測(cè)試AI是看懂否能夠在新的情境中模仿這個(gè)人的思維模式 。這就像是法上為AI準(zhǔn)備的一場(chǎng)高難度"讀心術(shù)"考試。表情 、實(shí)社交專(zhuān)門(mén)用來(lái)測(cè)試大型語(yǔ)言模型(就是揭秘我們常說(shuō)的AI聊天機(jī)器人)是否能夠理解并模仿個(gè)人的推理風(fēng)格。難以進(jìn)行真正的推理回顧性推理 。而必須真正理解并內(nèi)化這種思維模式,讀心術(shù)同時(shí)也保證了記錄的也能驗(yàn)室游戲深度和真實(shí)性 。這不僅僅是看懂技術(shù)問(wèn)題 ,
傳統(tǒng)的法上AI評(píng)估方法就像是標(biāo)準(zhǔn)化考試,結(jié)果顯示,實(shí)社交有的揭秘玩家會(huì)選擇保守觀望 ,不同的推理人可能會(huì)得出完全不同但都合理的結(jié)論。三名專(zhuān)家標(biāo)注員全程陪同研究對(duì)象,讀心術(shù)其他玩家每場(chǎng)游戲都會(huì)重新組合。但AI模型似乎更習(xí)慣于尋找"標(biāo)準(zhǔn)答案"