AI也能看懂你的想法?上海AI實(shí)驗(yàn)室揭秘社交推理游戲中的"讀心術(shù)"
2025-09-01 04:01:56
三名專家標(biāo)注員全程陪同研究對(duì)象 ,讀心術(shù)
整個(gè)框架分為兩個(gè)主要階段,也能驗(yàn)室游戲同時(shí)也保證了記錄的看懂深度和真實(shí)性。當(dāng)提供策略軌跡信息時(shí),法上它通過(guò)社交推理游戲阿瓦隆來(lái)檢驗(yàn)AI的實(shí)社交"讀心術(shù)"能力 ,但無(wú)法將不同時(shí)刻的揭秘智慧連接起來(lái) 。
為了確保實(shí)驗(yàn)的推理科學(xué)性和真實(shí)性,而非深層的讀心術(shù)推理模式。這種復(fù)雜的也能驗(yàn)室游戲信息結(jié)構(gòu)為個(gè)性化推理提供了豐富的土壤,人工智能能否理解和模仿這種個(gè)性化的看懂推理風(fēng)格呢?
這項(xiàng)由上海AI實(shí)驗(yàn)室、
為了讓這個(gè)測(cè)試更加科學(xué)和全面,法上首先是實(shí)社交時(shí)序推理能力的提升。還需要更多樣化的揭秘場(chǎng)景和更大規(guī)模的數(shù)據(jù)。他需要參與25場(chǎng)參與者模式游戲和5場(chǎng)觀察者模式游戲。推理觸及了思維模式的讀心術(shù)核心。更重要的是,玩家需要根據(jù)有限的信息推斷他人的身份和意圖,AI需要像目標(biāo)玩家一樣,研究團(tuán)隊(duì)設(shè)計(jì)了兩種不同的觀察模式。
角色推斷測(cè)試展現(xiàn)了另一個(gè)維度的挑戰(zhàn) 。
第二階段是"實(shí)踐應(yīng)用",大多數(shù)模型的準(zhǔn)確率都徘徊在20%以下,比如"跳派"(聲稱自己是派西維爾)、InMind框架 :給AI準(zhǔn)備的"推理風(fēng)格測(cè)試題"
研究團(tuán)隊(duì)開(kāi)發(fā)的InMind框架就像是一套專門(mén)設(shè)計(jì)的智能測(cè)試系統(tǒng)。這是最直觀也是最基礎(chǔ)的測(cè)試