當前位置:首頁>綜合>>南京航空航天大學:如何讓聊天機器人拒絕回答危險問題正文
Q2:D-Attack攻擊方法的人拒成功率有多高 ?對哪些AI模型最有效?
A:D-Attack的成功率因AI模型而異,新一代推理模型在抵御傳統(tǒng)攻擊方面確實取得了顯著進步 ,險問導致研究人員無法準確判斷AI的南京安全防護是否真正有效