0

我正在考虑使用 Cloud DLP 来帮助我匿名化我的数据。但是,我似乎无法明确提及支持哪些语言。AWS Comprehend 的检测 PII API 仅支持英语,因此正在寻找替代方案。

4

1 回答 1

2

在探测器参考页面中,您可以找到每个国家/地区的探测器

https://cloud.google.com/dlp/docs/infotypes-reference

对于 PHONE_NUMBER 等全局检测器,没有关于支持的语言的信息,但您可以在演示页面中测试对您的语言的支持

https://cloud.google.com/dlp/demo/#!/

例如,如果您用西班牙语书写Mi teléfono es 600111222(我的手机是 600111222),它会检测到具有 LIKELY 可能性的 PHONE_NUMBER,但是如果您书写Me puedes llamar al 600111222(您可以拨打 600111222 给我打电话),它只会检测到具有 LOW 可能性的 GENERIC_ID。

此外,如果在前面的示例中添加国家/地区前缀 (+34600111222),则第一个示例中的可能性增加到 VERY_LIKELY 并且第二个示例将 PHONE_NUMBER 检测为 POSSIBLE

总之,它适用于其他语言并使用上下文来改进匹配,但您应该使用一些示例来检查您的特定用例的准确性

于 2021-03-02T08:35:42.217 回答