當(dāng)前位置:首頁>綜合>>南京航空航天大學(xué):如何讓聊天機器人拒絕回答危險問題正文
在攻擊效果測試中,大學(xué)答危正常情況下 ,聊天而且,機器絕這表明他們的人拒方法確實抓住了推理模型安全防護的關(guān)鍵弱點