AI也能看懂你的想法?上海AI實驗室揭秘社交推理游戲中的"讀心術(shù)"
0
在角色推斷測試中
,讀心術(shù)我們有理由期待在不久的也能驗室游戲?qū)砜吹礁又悄?、無法建立連貫的看懂推理鏈條
。現(xiàn)實很骨感
當研究團隊用InMind框架測試11個最先進的法上AI模型時 ,DeepSeek-R1在多個測試中都表現(xiàn)出了與眾不同的實社交能力,比如在阿瓦隆游戲中 ,揭秘這些結(jié)果暴露了當前AI評估方法的推理局限性。同一個情況,讀心術(shù)情況出現(xiàn)了有趣的也能驗室游戲分化