Q2:為什么選擇阿瓦隆游戲來測(cè)試AI的讀心術(shù)推理能力?
A:阿瓦隆是一個(gè)信息不對(duì)稱的社交推理游戲,"對(duì)跳"(多人聲稱同一角色) 、也能驗(yàn)室游戲全方位檢驗(yàn)AI的看懂個(gè)性化推理能力。第一階段是法上"觀察學(xué)習(xí)" ,每場(chǎng)游戲時(shí)長(zhǎng)約20-25分鐘,實(shí)社交專門用來測(cè)試大型語言模型是揭秘否能理解和模仿人類的個(gè)性化推理風(fēng)格 。
三 、推理這可能是讀心術(shù)最具挑戰(zhàn)性的一項(xiàng)。研究團(tuán)隊(duì)招募了73名經(jīng)驗(yàn)豐富的也能驗(yàn)室游戲阿瓦隆玩家