南京航空航天大學:如何讓聊天機器人拒絕回答危險問題
2025-09-01 04:33:38
對于o4-Mini模型 ,南京讓AI按照攻擊者設計的航空航天何讓思路進行思考。這就像給AI戴上了一副有色眼鏡,大學答危研究團隊還會在其中嵌入一些看似無害的聊天示例問答。
Q&A
Q1 :MDH系統(tǒng)是機器絕什么?它是如何篩選有害問題的
2025-09-01 04:33:38
對于o4-Mini模型 ,南京讓AI按照攻擊者設計的航空航天何讓思路進行思考。這就像給AI戴上了一副有色眼鏡,大學答危研究團隊還會在其中嵌入一些看似無害的聊天示例問答。
Q&A
Q1 :MDH系統(tǒng)是機器絕什么?它是如何篩選有害問題的