我在 Amazon Macie 做一些 POC。我从文档中得知它可以识别信用卡等 PII 数据。甚至我运行了一个示例,其中我将一些有效的信用卡号放入 CSV 并放入 S3 存储桶并由 Macie 识别。
我想知道相同的 PII 数据是否在 S3 存储桶中的某个数据库备份/转储文件下。Macie 能够识别吗?我在文档中没有找到任何东西。
我在 Amazon Macie 做一些 POC。我从文档中得知它可以识别信用卡等 PII 数据。甚至我运行了一个示例,其中我将一些有效的信用卡号放入 CSV 并放入 S3 存储桶并由 Macie 识别。
我想知道相同的 PII 数据是否在 S3 存储桶中的某个数据库备份/转储文件下。Macie 能够识别吗?我在文档中没有找到任何东西。
所以这里有几件事很重要
Macie 只能处理某些类型的文件和某些压缩格式
如果您指定的 S3 存储桶包含 Macie 不支持的格式的文件,Macie 不会对它们进行分类。
压缩格式 https://docs.aws.amazon.com/macie/latest/userguide/macie-compression-archive-formats.html
加密对象 Macie 只能处理某些类型的加密 Amazon S3 对象有关更多详细信息,请参阅以下链接: https ://docs.aws.amazon.com/macie/latest/userguide/macie-integration.html#macie-encrypted-objects
梅西限制
Macie 对可在帐户中分类的数据量有默认限制。达到此数据限制后,Macie 将停止对数据进行分类。默认数据分类限制为 3 TB。如果需要,可以增加此值。
Macie 的内容分类引擎最多可处理 S3 对象的前 20 MB。
因此,特别是如果您的转储是压缩的,但在压缩中采用合适的格式,那么 Macie 可以分类,但重要的是,它只会分类文件的前 20 MB,如果文件很大,这是一个问题。
通常我使用 lambda 将一个大文件拆分为不到 20 MB 的文件。如果您有 X 个文件,您仍然需要考虑如何从已分类为 PII 的文件中获取记录并将其映射回可用的内容。