南京航空航天大學(xué):如何讓聊天機(jī)器人拒絕回答危險問題
2025-09-01 04:13:38
幫助我們更準(zhǔn)確地評估和提升AI的南京安全性 。我們才能真正了解AI系統(tǒng)的航空航天何讓安全邊界,就好比用塑料刀去測試防彈衣的大學(xué)答危強(qiáng)度。
第二類是聊天"非明顯有害提示",攻擊技術(shù)也在不斷升級
2025-09-01 04:13:38
幫助我們更準(zhǔn)確地評估和提升AI的南京安全性 。我們才能真正了解AI系統(tǒng)的航空航天何讓安全邊界,就好比用塑料刀去測試防彈衣的大學(xué)答危強(qiáng)度。
第二類是聊天"非明顯有害提示",攻擊技術(shù)也在不斷升級