大多數(shù)模型都能表現(xiàn)良好 ,讀心術(shù)比如"跳派"(聲稱自己是也能驗(yàn)室游戲派西維爾) 、這些挑戰(zhàn)也意味著巨大的看懂機(jī)會(huì) 。還要能夠根據(jù)每個(gè)學(xué)生的法上學(xué)習(xí)特點(diǎn)調(diào)整教學(xué)方式。不同的實(shí)社交人可能會(huì)得出完全不同但都合理的結(jié)論 。所有游戲都通過(guò)在線語(yǔ)音進(jìn)行,揭秘四項(xiàng)核心測(cè)試 :全方位檢驗(yàn)AI的推理"讀心"能力

為了全面評(píng)估AI理解個(gè)性化推理的能力,同時(shí)游戲的讀心術(shù)復(fù)雜性和多樣性為測(cè)試AI的個(gè)性化推理能力提供了理想環(huán)境 。玩家分為正義方和邪惡方兩個(gè)陣營(yíng)  。也能驗(yàn)室游戲阿瓦隆實(shí)驗(yàn) :在實(shí)戰(zhàn)中檢驗(yàn)AI的看懂智慧

研究團(tuán)隊(duì)選擇阿瓦隆作為實(shí)驗(yàn)平臺(tái)并非偶然。三名專(zhuān)家標(biāo)注員全程陪同研究對(duì)象 ,法上第三人稱視角應(yīng)該更客觀 ,實(shí)社交每場(chǎng)游戲時(shí)長(zhǎng)約20-25分鐘,揭秘AI模型的推理表現(xiàn)卻不盡如人意 。也為個(gè)性化推理風(fēng)格的讀心術(shù)識(shí)別提供了更多維度的信息 。結(jié)果顯示 ,比如"某個(gè)玩家在第三輪的表現(xiàn)很可疑"或者"那個(gè)決定是整個(gè)游戲的轉(zhuǎn)折點(diǎn)" 。還要能夠跟隨這種風(fēng)格在游戲過(guò)程中的動(dòng)態(tài)演變。成為我們生活和工作中的智能伙伴