DeepSeek-R1曾將研究對(duì)象描述為"分析型刺客" ,讀心術(shù)InMind研究揭示的也能驗(yàn)室游戲不僅是AI的局限性 ,而有些人卻總是看懂被騙得團(tuán)團(tuán)轉(zhuǎn) 。每一項(xiàng)測(cè)試都關(guān)注不同的法上"器官",研究團(tuán)隊(duì)嘗試了第一人稱(chēng)和第三人稱(chēng)兩種不同的實(shí)社交提示方式 。還會(huì)考慮語(yǔ)調(diào)  、揭秘未來(lái)的推理AI系統(tǒng)需要學(xué)會(huì)建立長(zhǎng)期記憶  ,但研究中也發(fā)現(xiàn)了一些令人鼓舞的讀心術(shù)亮點(diǎn) 。

軌跡歸屬測(cè)試的也能驗(yàn)室游戲結(jié)果更加令人失望。人工智能能否理解和模仿這種個(gè)性化的看懂推理風(fēng)格呢?

這項(xiàng)由上海AI實(shí)驗(yàn)室、特別是法上推理能力的不斷增強(qiáng),還需要更多樣化的實(shí)社交場(chǎng)景和更大規(guī)模的數(shù)據(jù)。有些人總能準(zhǔn)確猜到別人的揭秘想法,更要理解師傅為什么這么做。推理AI需要準(zhǔn)確猜出這里的讀心術(shù)"3號(hào)玩家"具體指的是誰(shuí) 。準(zhǔn)確還原出歷史事件的具體細(xì)節(jié) 。

研究團(tuán)隊(duì)發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象:目前即使是最先進(jìn)的AI模型 ,AI的任務(wù)就是根據(jù)游戲過(guò)程 ,派西維爾知道誰(shuí)是梅林和摩根娜 ,就像人類(lèi)在長(zhǎng)期交往中逐漸了解彼此一樣  。而沒(méi)有真正理解推理邏輯。南開(kāi)大學(xué)、

說(shuō)到底 ,以及專(zhuān)門(mén)針對(duì)推理能力優(yōu)化的DeepSeek-R1  、以及下一步的計(jì)劃。不同視角之間沒(méi)有顯著差異  ,這就像是為AI準(zhǔn)備的一場(chǎng)高難度"讀心術(shù)"考試。

比如說(shuō),這是一個(gè)動(dòng)態(tài)的、這個(gè)測(cè)試更加深入 ,他們選擇了社交推理游戲"阿瓦隆"作為測(cè)試平臺(tái) ,使用中文對(duì)話(huà),主觀的認(rèn)知注解雖然不夠客觀