我想要一个代码示例来说明如何从聪明的 hans 的对抗性攻击中生成训练数据。
adv_x = fgsm.generate_np(X_test, **fgsm_params)
这会生成对抗性 x 数据,但我怎样才能得到 y?
adv_pred = model.predict_classes(adv_x)
这会给出“上当”的结果,对吗?
我想要的是正确显示生成的 x、y、被愚弄的 y(我的意思是模型预测的结果可能由于攻击而错误)。顺便说一句,我正在使用 Mnist,如果有帮助的话。