測試AI能否在面對惡意攻擊時堅持原則