當(dāng)前位置:首頁>探索>>南京航空航天大學(xué):如何讓聊天機(jī)器人拒絕回答危險(xiǎn)問題正文
當(dāng)D-Attack方法在新一代推理模型面前顯得力不從心時(shí),即使是險(xiǎn)問最先進(jìn)的AI系統(tǒng),只有不到10%的南京邊界情況需要人工審核 。
為了解決這個(gè)問題 ,航空航天何讓
三