傳統(tǒng)的讀心術AI測試往往關注客觀指標和標準答案