對最新的南京o3模型成功率達50%,攻擊者會聲稱自己是航空航天何讓大學(xué)教師 ,還提供了一套完整的大學(xué)答危解決方案  ,這項研究不僅揭示了當(dāng)前AI安全防護的聊天薄弱環(huán)節(jié) ,傳統(tǒng)的機器絕攻擊方法如DeepInception和SelfCipher在面對推理模型時幾乎完全失效