先讓AI回答一些正常的南京教育問題,這三類不合格問題的航空航天何讓比例高得驚人 。研究結果表明 ,大學答危DH-CoT需要為每個具體問題定制偽造的聊天思維鏈 ,導致研究人員無法準確判斷AI的機器絕安全防護是否真正有效。需要建立更加完善的人拒第三方安全評估體系