Google 数据丢失防护 API 是否支持 .pdf 或 .docx?我正在尝试减少 Java 中的 *.pdf 文件以隐藏敏感数据。
非常感谢!惠美
Google 数据丢失防护 API 是否支持 .pdf 或 .docx?我正在尝试减少 Java 中的 *.pdf 文件以隐藏敏感数据。
非常感谢!惠美
内容流式传输的方法支持图像、文本和二进制数据。您可以通过 ByteContentItem https://cloud.google.com/dlp/docs/reference/rpc/google.privacy.dlp.v2#contentitem流式传输您的 pdf,或者您可以将您的 PDF 转换为图像并将它们扫描为图像。
如果在 GCS 中扫描内容,可以从 PDF 中检测到一些 PII,但您应该测试您的用例。
目前,Google Data Loss Prevention API仅支持文本字符串。
样本输入:
{
"items":
[
{
"value": "My phone number is (123) 456-7890",
"type": "text/plain"
}
],
"replaceConfigs":
[
{
"replaceWith": "[REDACTED PHONE NUMBER]",
"infoType":
{
"name": "PHONE_NUMBER"
}
}
]
}
网址:POST https://dlp.googleapis.com/v2beta1/content:redact
样本输出:
{
"items": [
{
"type": "text/plain",
"value": "My phone number is [REDACTED PHONE NUMBER]"
}
]
}