梅林只有41%的讀心術(shù)幾率被正確識(shí)別,這些模型包括我們熟悉的也能驗(yàn)室游戲GPT-4o