我有超过一百万张我想用作训练数据的图像。如何在不影响安全性的情况下免费提供这些数据?
我希望用户能够快速将其用于培训目的,而不会让黑客有机会从开源数据中重建图像。同时我不希望培训质量受到任何影响。
换句话说,我如何安全地开源图像?
例如,此代码生成 numpy 数组。在这种情况下,我只是想让从 ndarray "x" 重建原始图像变得非常困难。
from keras.preprocessing.image import ImageDataGenerator, array_to_img, img_to_array, load_img
i = load_img('some_image.jpg' )
x = img_to_array(i)
x = x.reshape((1,) + x.shape)
一旦我知道黑客无法使用数据并创建相同的图像,我就可以共享数组 x。