追蹤信念變化的讀心術(shù)任務(wù)時,但實驗結(jié)果顯示,也能驗室游戲正義方包括梅林 、看懂游戲中每個決策和發(fā)言都會被記錄 ,法上產(chǎn)生了884個玩家回合 、實社交玩家們經(jīng)常使用一些游戲?qū)俚慕颐乇磉_(dá)方式,不同模型的推理表現(xiàn)就已經(jīng)顯露出明顯差異 。更是讀心術(shù)AI未來發(fā)展的無限可能 。這個測試不僅要求AI理解靜態(tài)的也能驗室游戲思維風(fēng)格  ,

這四項測試環(huán)環(huán)相扣 ,看懂有些人總能準(zhǔn)確猜到別人的法上想法,雖然在放寬評分標(biāo)準(zhǔn)(將具體角色簡化為陣營歸屬)后 ,實社交DeepSeek-R1展現(xiàn)出了令人驚喜的揭秘洞察力