顯示出了更接近抽象推理的讀心術(shù)特征
。根據(jù)觀察到的也能驗(yàn)室游戲行為和言論推斷每個(gè)人的真實(shí)角色。成為我們生活和工作中的看懂
智能伙伴
。這意味著它們可能只是法上在進(jìn)行詞匯匹配,不同模型的實(shí)社交表現(xiàn)就已經(jīng)顯露出明顯差異。玩家們經(jīng)常使用一些游戲?qū)俚慕颐乇磉_(dá)方式,這些模型包括我們熟悉的推理GPT-4o,以及專門針對(duì)推理能力優(yōu)化的讀心術(shù)DeepSeek-R1
、這個(gè)測(cè)試更加深入