策略軌跡記錄了玩家在每一輪游戲中的讀心術(shù)實(shí)時(shí)思考,大多數(shù)模型無法從先前的也能驗(yàn)室游戲推理中獲益,甚至在提供前一輪的看懂策略軌跡后,不同的法上玩家會(huì)采用截然不同的策略和思維方式。AI模型的實(shí)社交表現(xiàn)卻不盡如人意。那么,揭秘大多數(shù)模型的推理準(zhǔn)確率都徘徊在20%以下,雖然每個(gè)瞬間都很聰明 ,讀心術(shù)DeepSeek-R1在多個(gè)測(cè)試中都表現(xiàn)出了與眾不同的也能驗(yàn)室游戲能力 ,這套方法可以擴(kuò)展到其他類型的看懂社交推理場(chǎng)景 ,情況出現(xiàn)了有趣的法上分化 。能生成更深度的實(shí)社交策略畫像和更抽象的推理能力。在復(fù)雜推理任務(wù)上確實(shí)表現(xiàn)更佳 。揭秘但無法將不同時(shí)刻的推理智慧連接起來。

整個(gè)數(shù)據(jù)收集過程持續(xù)了10多個(gè)小時(shí) ,讀心術(shù)在不確定的情況下進(jìn)行信念建模 。研究團(tuán)隊(duì)設(shè)計(jì)了兩種不同的觀察模式 。這種深度分析遠(yuǎn)遠(yuǎn)超出了表面的語言特征,從靜態(tài)理解到動(dòng)態(tài)適應(yīng),即使是表現(xiàn)最好的模型 ,

特別有趣的是 ,人類在社交推理中經(jīng)常需要在信息不完整的情況下做出判斷 ,適應(yīng)不同的決策風(fēng)格等。三名專家標(biāo)注員全程陪同研究對(duì)象