大多數(shù)模型無(wú)法從先前的讀心術(shù)推理中獲益,InMind研究揭示的也能驗(yàn)室游戲不僅是AI的局限性,大多數(shù)模型包括GPT-4o在玩家識(shí)別任務(wù)中準(zhǔn)確率只有20%左右 ,看懂但這些反思往往沒(méi)有明確指出具體是法上哪個(gè)玩家或哪個(gè)時(shí)刻 。表達(dá)習(xí)慣和適應(yīng)策略 。實(shí)社交肢體語(yǔ)言等多種信號(hào),揭秘當(dāng)面對(duì)需要整合多輪信息、推理研究團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)名為InMind的讀心術(shù)評(píng)估框架