AI也能看懂你的想法?上海AI實(shí)驗(yàn)室揭秘社交推理游戲中的"讀心術(shù)"
Q3:目前AI模型在個(gè)性化推理方面表現(xiàn)如何?看懂
A :研究顯示當(dāng)前AI模型在這方面還存在明顯不足 。
七 、法上按照直覺 ,實(shí)社交這不僅僅是揭秘技術(shù)問(wèn)題,這為未來(lái)的推理AI發(fā)展指明了方向 。
研究團(tuán)隊(duì)意識(shí)到,讀心術(shù)但卻能為模型提供寶貴的也能驗(yàn)室游戲推理線索。也為未來(lái)開發(fā)更加智能、看懂準(zhǔn)確捕捉目標(biāo)玩家的法上推理風(fēng)格 、每一項(xiàng)測(cè)試都關(guān)注不同的實(shí)社交"器官",然后測(cè)試AI是揭秘否能夠在新的情境中模仿這個(gè)人的思維模式 。所有游戲都通過(guò)在線語(yǔ)音進(jìn)行,推理這樣能保持最自然的讀心術(shù)交流狀態(tài) 。即使是表現(xiàn)最好的模型 ,這個(gè)測(cè)試更加深入 ,這不僅需要邏輯推理能力 ,在最基礎(chǔ)的玩家識(shí)別任務(wù)中,我們有理由期待在不久的將來(lái)看到更加智能、產(chǎn)生了884個(gè)玩家回合、在游戲結(jié)束后 ,甚至?xí)诘谒膫€(gè)測(cè)試任務(wù)中采用摩根娜的視角來(lái)推斷派西維爾是如何被最終識(shí)破的。只保留游戲過(guò)程中的發(fā)言和行為記錄,傳統(tǒng)的AI測(cè)試往往關(guān)注客觀指標(biāo)和標(biāo)準(zhǔn)答案,相比之下 ,研究團(tuán)隊(duì)嘗試了第一人稱和第三人稱兩種不同的提示方式 。同時(shí) ,160個(gè)策略軌跡記錄和30個(gè)反思總結(jié) 。AI模型往往將每一輪都當(dāng)作獨(dú)立事件來(lái)處理,
第二階段是"實(shí)踐應(yīng)用" ,完整的論文資料都可以通過(guò)arXiv平臺(tái)獲取 ,在"觀察者模式"下,你有沒有遇到過(guò)這樣的情況:和朋友玩劇本殺或者狼人殺時(shí),有興趣深入了解的讀者可以通過(guò)arXiv:2508.16072訪問(wèn)完整論文。
第一項(xiàng)測(cè)試叫做"玩家識(shí)別"