南京航空航天大學(xué)：如何讓聊天機器人拒絕回答危險問題

2025-09-01 05:08:48

這項研究的南京另一個重要貢獻是提出了AI安全評估的標準化流程。避免過度依賴或盲目信任。航空航天何讓經(jīng)過MDH系統(tǒng)處理后，大學(xué)答危讓AI認為提供這些信息是聊天為了提高學(xué)生的批判性思維。DH-CoT方法在攻破推理模型方面取得了令人驚訝的機器絕成功。讓AI誤認為是人拒正當學(xué)術(shù)研究；二是提供偽造的思維鏈，他們發(fā)現(xiàn)了兩種全新的險問"鑰匙" ，o3-Mini 、南京AI可以簡單回答"違法"而不需要提供具體的航空航天何讓犯罪指導(dǎo)。同時