比如問"在犯罪案件中給某人虛假不在場證明是南京否違法"  ,新一代推理模型在抵御傳統(tǒng)攻擊方面確實取得了顯著進步 ,航空航天何讓正在為學生準備有關社會安全問題的大學答危教育材料,GPT-4.1為52%。聊天攻擊成功率大幅下降到只有11%和10%