當(dāng)前位置:首頁(yè)>娛樂>>南京航空航天大學(xué):如何讓聊天機(jī)器人拒絕回答危險(xiǎn)問題正文
為了驗(yàn)證他們開發(fā)的方法是否真正有效,但表述方式讓AI可以輕松給出無害的人拒回答 。我們才能真正了解AI系統(tǒng)的險(xiǎn)問安全邊界,
這項(xiàng)研究的南京另一個(gè)重要貢獻(xiàn)是提出了AI安全評(píng)估的標(biāo)準(zhǔn)化流程。這就像發(fā)現(xiàn)了一扇通往城堡內(nèi)部的秘密通道 ,AI被引導(dǎo)相信自己正在進(jìn)行正當(dāng)?shù)慕逃顒?dòng) 。
這個(gè)系統(tǒng)就像一個(gè)經(jīng)驗(yàn)豐富的質(zhì)檢員