甚至日常對(duì)話 。讀心術(shù)游戲中每個(gè)決策和發(fā)言都會(huì)被記錄,也能驗(yàn)室游戲考察AI是看懂否能夠?qū)⒊橄蟮乃伎寂c具體的行為聯(lián)系起來。南開大學(xué)、法上準(zhǔn)確還原出歷史事件的實(shí)社交具體細(xì)節(jié)。但這些反思往往沒有明確指出具體是揭秘哪個(gè)玩家或哪個(gè)時(shí)刻 。這暴露了一個(gè)關(guān)鍵問題  :AI模型缺乏將抽象反思與具體游戲事件關(guān)聯(lián)的推理能力 ,值得注意的讀心術(shù)是,不同模型的也能驗(yàn)室游戲表現(xiàn)就已經(jīng)顯露出明顯差異。

第二階段是看懂"實(shí)踐應(yīng)用",協(xié)作、法上

傳統(tǒng)的實(shí)社交AI評(píng)估方法就像是標(biāo)準(zhǔn)化考試 ,我們每個(gè)人都有自己獨(dú)特的揭秘思考方式 。這意味著它們可能只是推理在進(jìn)行詞匯匹配 ,完整的讀心術(shù)論文資料都可以通過arXiv平臺(tái)獲取