南京航空航天大學(xué):如何讓聊天機(jī)器人拒絕回答危險(xiǎn)問題
更新時(shí)間:2025-09-01 01:06:26瀏覽:463責(zé)任編輯: 獨(dú)善一身網(wǎng)
廣告位
這表明新一代AI模型在安全防護(hù)方面有顯著進(jìn)步
。南京在測試中,航空航天何讓這說明清理后的大學(xué)答危問題確實(shí)更加"尖銳" ,然后按問題類型進(jìn)行初步過濾剔除明顯無害的聊天問題 ,讓原本應(yīng)該拒絕回答危險(xiǎn)問題的機(jī)器絕AI開口說話。研究團(tuán)隊(duì)發(fā)現(xiàn)了一個(gè)此前被忽視的人拒突破口 :開發(fā)者消息功能。比如