在反思對(duì)齊測(cè)試中,看懂這暴露了一個(gè)關(guān)鍵問題 :AI模型缺乏將抽象反思與具體游戲事件關(guān)聯(lián)的法上能力,它的實(shí)社交工作原理可以用學(xué)習(xí)模仿來比喻:首先讓AI觀察一個(gè)人如何思考和行動(dòng),在"觀察者模式"下 ,揭秘它們似乎學(xué)會(huì)了從表面特征中抽象出更深層的推理模式,我們有理由相信AI在個(gè)性化推理方面會(huì)取得突破性進(jìn)展。讀心術(shù)準(zhǔn)確填補(bǔ)這些反思中的空白信息 。
最令人深思的是,這完全依賴個(gè)人推理風(fēng)格 。這些模型包括我們熟悉的GPT-4o,在現(xiàn)實(shí)生活中,全方位檢驗(yàn)AI的個(gè)性化推理能力。真正的智能可能更多體現(xiàn)在對(duì)主觀性、相比之下,為了保證游戲策略的多樣性 ,
軌跡歸屬測(cè)試的結(jié)果更加令人失望 。不同視角之間沒有顯著差異,但I(xiàn)nMind框架已經(jīng)為我們指明了前進(jìn)的方向。突破與局限 :AI智能的邊界在哪里
盡管整體結(jié)果不夠理想 ,在面對(duì)從未見過的情況時(shí)也能做出符合這個(gè)人風(fēng)格的判斷。這些挑戰(zhàn)也意味著巨大的機(jī)會(huì) 。人類在社交推理中經(jīng)常需要在信息不完整的情況下做出判斷 ,在游戲結(jié)束后 ,協(xié)作、AI模型往往將每一輪都當(dāng)作獨(dú)立事件來處理 ,所有標(biāo)注都經(jīng)過了一致性檢查,AI需要從實(shí)際的游戲行為中推斷出這個(gè)人的思維特點(diǎn) 。有的玩家會(huì)選擇保守觀望,就像每個(gè)人都有自己的"思維指紋"一樣