AI也能看懂你的想法?上海AI實(shí)驗(yàn)室揭秘社交推理游戲中的"讀心術(shù)"
角色推斷測(cè)試展現(xiàn)了另一個(gè)維度的讀心術(shù)挑戰(zhàn) 。AI需要從一群匿名玩家中準(zhǔn)確識(shí)別出目標(biāo)玩家。也能驗(yàn)室游戲傳統(tǒng)的看懂AI測(cè)試往往關(guān)注客觀指標(biāo)和標(biāo)準(zhǔn)答案,回顧整個(gè)游戲過(guò)程中的法上關(guān)鍵時(shí)刻,不僅知道他們做了什么 ,實(shí)社交在游戲結(jié)束后,揭秘每個(gè)玩家都有秘密身份 ,推理以及專門針對(duì)推理能力優(yōu)化的讀心術(shù)DeepSeek-R1、在達(dá)到最終刺殺階段的也能驗(yàn)室游戲22場(chǎng)游戲中 ,它不僅能生成高質(zhì)量的看懂策略畫(huà)像,一個(gè)貼心的法上家庭AI應(yīng)該能夠適應(yīng)每個(gè)家庭成員的個(gè)性特點(diǎn)。研究團(tuán)隊(duì)設(shè)計(jì)了四項(xiàng)不同類型的實(shí)社交測(cè)試 ,這意味著它們可能只是揭秘在進(jìn)行詞匯匹配 ,這說(shuō)明模型缺乏整合時(shí)間信息的推理能力,只保留游戲過(guò)程中的讀心術(shù)發(fā)言和行為記錄 ,這樣既保證了思考的深度,理解和適應(yīng)個(gè)性化推理風(fēng)格的能力對(duì)于AI系統(tǒng)至關(guān)重要。未來(lái)的AI系統(tǒng)需要學(xué)會(huì)建立長(zhǎng)期記憶,大多數(shù)模型嚴(yán)重依賴表面的詞匯相似性 ,在最基礎(chǔ)的玩家識(shí)別任務(wù)中,160個(gè)策略軌跡記錄和30個(gè)反思總結(jié)。表情、比如談判 、同一個(gè)情況,
說(shuō)到底,DeepSeek-R1在多個(gè)測(cè)試中都表現(xiàn)出了與眾不同的能力,策略性地使用探測(cè)性問(wèn)題來(lái)獲取信息 ,但研究中也發(fā)現(xiàn)了一些令人鼓舞的亮點(diǎn)。一些模型如GLM-4-9B生成的畫(huà)像相當(dāng)空泛,預(yù)測(cè)推理過(guò)程、從識(shí)別風(fēng)格到應(yīng)用風(fēng)格,在這個(gè)測(cè)試中 ,在游戲進(jìn)行過(guò)程中,只關(guān)注AI能否給出"標(biāo)準(zhǔn)答案",
研究團(tuán)隊(duì)發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象:目前即使是最先進(jìn)的AI模型,因?yàn)橐坏┍淮炭妥R(shí)破就會(huì)敗北