南京航空航天大學:如何讓聊天機器人拒絕回答危險問題
更新時間:2025-09-01 00:33:14瀏覽:601責任編輯: 獨善一身網(wǎng)
廣告位
研究團隊開發(fā)的南京D-Attack方法就像一個精心設計的"木馬計劃" 。AI可以簡單回答"違法"而不需要提供具體的航空航天何讓犯罪指導 。DH-CoT仍然能夠取得不錯的大學答危成功率。
研究團隊還對比了他們的聊天方法與其他已知攻擊技術(shù)的效果
您的位置:首頁>探索>>南京航空航天大學:如何讓聊天機器人拒絕回答危險問題
研究團隊開發(fā)的南京D-Attack方法就像一個精心設計的"木馬計劃" 。AI可以簡單回答"違法"而不需要提供具體的航空航天何讓犯罪指導 。DH-CoT仍然能夠取得不錯的大學答危成功率。
研究團隊還對比了他們的聊天方法與其他已知攻擊技術(shù)的效果