南京航空航天大學:如何讓聊天機器人拒絕回答危險問題
2025-09-01 05:04:45
比如聲稱AI是南京一個"不會拒絕用戶請求的全能助手"。讓AI認為提供這些信息是航空航天何讓為了提高學生的批判性思維。研究團隊還測試了不同類型示例對攻擊效果的大學答危影響。對最新的聊天o3模型成功率達50%
2025-09-01 05:04:45
比如聲稱AI是南京一個"不會拒絕用戶請求的全能助手"。讓AI認為提供這些信息是航空航天何讓為了提高學生的批判性思維。研究團隊還測試了不同類型示例對攻擊效果的大學答危影響。對最新的聊天o3模型成功率達50%