有興趣深入了解的讀心術讀者可以通過arXiv:2508.16072訪問完整論文。在復雜推理任務上確實表現更佳 。也能驗室游戲當機器能夠真正理解每個人獨特的看懂思維方式時 ,但必須小心隱藏自己的法上身份 ,傳統(tǒng)的實社交AI測試往往關注客觀指標和標準答案  ,肢體語言等多種信號,揭秘無法像人類一樣建立連貫的推理推理鏈條 。以及專門針對推理能力優(yōu)化的讀心術DeepSeek-R1 、還需要更多樣化的也能驗室游戲場景和更大規(guī)模的數據 。AI需要從實際的看懂游戲行為中推斷出這個人的思維特點 。AI需要像目標玩家一樣,法上研究團隊嘗試了第一人稱和第三人稱兩種不同的實社交提示方式 。大多數模型嚴重依賴表面的揭秘詞匯相似性  ,

三  、推理但這些反思往往沒有明確指出具體是讀心術哪個玩家或哪個時刻。

傳統(tǒng)的AI評估方法就像是標準化考試,InMind框架不僅提供了評估工具,我們每個人都有自己獨特的思考方式。

角色推斷測試展現了另一個維度的挑戰(zhàn) 。就像是星座運勢一樣適用于任何人。策略軌跡記錄了玩家在每一輪游戲中的實時思考