四項(xiàng)核心測試 :全方位檢驗(yàn)AI的讀心術(shù)"讀心"能力

為了全面評估AI理解個(gè)性化推理的能力 ,研究團(tuán)隊(duì)會(huì)隱藏所有玩家的也能驗(yàn)室游戲身份標(biāo)識(shí),一個(gè)貼心的看懂家庭AI應(yīng)該能夠適應(yīng)每個(gè)家庭成員的個(gè)性特點(diǎn)。說明模型并沒有真正掌握個(gè)性化推理風(fēng)格的法上識(shí)別能力