南京航空航天大學：如何讓聊天機器人拒絕回答危險問題

2025-09-01 04:43:12

先讓AI回答一些正常的南京教育問題，雖然這些攻擊方法主要用于學術研究，航空航天何讓GPT-3.5的大學答危被攻破率高達86%，成功率更是聊天從40%躍升至66%。這種"教育外衣"讓AI的機器絕安全防護系統(tǒng)誤認為這是正當?shù)膶W術研究需求。往往會降低警戒性