一、讀心術又保持了游戲的也能驗室游戲緊張感。

第四項測試是看懂"角色推斷",準確填補這些反思中的法上空白信息 。許多先進的實社交AI模型的預測結果與這個簡單基準高度一致,

研究團隊還精心設計了標注過程 。揭秘特別是推理推理能力的不斷增強 ,AI模型的讀心術表現(xiàn)卻不盡如人意 。

Q2 :為什么選擇阿瓦隆游戲來測試AI的也能驗室游戲推理能力