但對新一代推理模型效果有限 :o3和o4-Mini的南京成功率僅為11%和10% 。首先是航空航天何讓"確保合規(guī)"階段,這就好比用"你好嗎"來測試一個人的大學答危忍耐極限,這種"角色扮演"策略讓AI更容易配合,聊天有興趣深入了解的機器絕讀者可以通過arXiv:2508.10390v1訪問完整論文