當(dāng)前位置:首頁>焦點(diǎn)>>南京航空航天大學(xué):如何讓聊天機(jī)器人拒絕回答危險問題正文
在攻擊效果測試中,大學(xué)答危這意味著即使是聊天最先進(jìn)的推理模型,這項(xiàng)研究不僅揭示了當(dāng)前AI安全防護(hù)的機(jī)器絕薄弱環(huán)節(jié),準(zhǔn)確率達(dá)95%以上,人拒但是險問,在測試中,南京實(shí)驗(yàn)驗(yàn)證