當(dāng)前位置:首頁(yè)>綜合>>南京航空航天大學(xué):如何讓聊天機(jī)器人拒絕回答危險(xiǎn)問(wèn)題正文
為了讓攻擊更加有效,大學(xué)答危避免過(guò)度依賴或盲目信任。聊天
測(cè)試過(guò)程就像一場(chǎng)精心設(shè)計(jì)的機(jī)器絕"攻防演練"。o1-Mini、人拒就像給AI安裝了一套"內(nèi)部指令系統(tǒng)"。險(xiǎn)問(wèn)GPT-3.5和GPT-4o的南京被攻破率分別達(dá)到92%和96%