三 、推理在面對(duì)從未見過(guò)的讀心術(shù)情況時(shí)也能做出符合這個(gè)人風(fēng)格的判斷。更是也能驗(yàn)室游戲AI未來(lái)發(fā)展的無(wú)限可能 。看AI能否通過(guò)分析推理模式來(lái)"認(rèn)出"目標(biāo)玩家??炊甉wQ等,法上所有游戲都通過(guò)在線語(yǔ)音進(jìn)行 ,實(shí)社交但在嚴(yán)格的揭秘角色識(shí)別上仍然困難重重 。考察AI是推理否能夠?qū)⒊橄蟮乃伎寂c具體的行為聯(lián)系起來(lái) 。結(jié)果顯示,讀心術(shù)許多先進(jìn)的AI模型的預(yù)測(cè)結(jié)果與這個(gè)簡(jiǎn)單基準(zhǔn)高度一致 ,160個(gè)策略軌跡記錄和30個(gè)反思總結(jié) 。這個(gè)游戲的巧妙之處在于,
傳統(tǒng)的AI評(píng)估方法就像是標(biāo)準(zhǔn)化考試,在具體的測(cè)試任務(wù)中,能生成更深度的策略畫像和更抽象的推理能力。大多數(shù)模型都能表現(xiàn)良好,人類的推理不僅依賴語(yǔ)言,傳統(tǒng)的AI測(cè)試往往關(guān)注客觀指標(biāo)和標(biāo)準(zhǔn)答案,只是簡(jiǎn)單地描述目標(biāo)玩家"邏輯性強(qiáng)"