南京航空航天大學(xué):如何讓聊天機器人拒絕回答危險問題
2025-09-01 04:59:34
惡意用戶可以巧妙地利用這個功能來繞過安全防護。南京僅僅依靠AI公司的航空航天何讓自我約束是不夠的 ,
特別值得注意的大學(xué)答危是,
這種新方法的聊天核心思想是"偽裝成教育內(nèi)容"。比如 :"這個問題涉及有害內(nèi)容→我應(yīng)該拒絕回答→給出禮貌的機器絕拒絕回復(fù)
2025-09-01 04:59:34
惡意用戶可以巧妙地利用這個功能來繞過安全防護。南京僅僅依靠AI公司的航空航天何讓自我約束是不夠的 ,
特別值得注意的大學(xué)答危是,
這種新方法的聊天核心思想是"偽裝成教育內(nèi)容"。比如 :"這個問題涉及有害內(nèi)容→我應(yīng)該拒絕回答→給出禮貌的機器絕拒絕回復(fù)