0

Google 数据丢失防护 API 是否支持 .pdf 或 .docx?我正在尝试减少 Java 中的 *.pdf 文件以隐藏敏感数据。

非常感谢!惠美

4

2 回答 2

0

内容流式传输的方法支持图像、文本和二进制数据。您可以通过 ByteContentItem https://cloud.google.com/dlp/docs/reference/rpc/google.privacy.dlp.v2#contentitem流式传输您的 pdf,或者您可以将您的 PDF 转换为图像并将它们扫描为图像。

如果在 GCS 中扫描内容,可以从 PDF 中检测到一些 PII,但您应该测试您的用例。

于 2019-04-09T21:20:45.333 回答
0

目前,Google Data Loss Prevention API仅支持文本字符串。

样本输入:

 {
    "items":
    [
      {
        "value": "My phone number is (123) 456-7890",
        "type": "text/plain"
      }
    ],
    "replaceConfigs":
    [
      {
        "replaceWith": "[REDACTED PHONE NUMBER]",
        "infoType":
        {
          "name": "PHONE_NUMBER"
        }
      }
    ]
  }

网址:POST https://dlp.googleapis.com/v2beta1/content:redact

样本输出:

 {
   "items": [
    {
     "type": "text/plain",
     "value": "My phone number is [REDACTED PHONE NUMBER]"
    }
   ]
  }
于 2017-08-15T03:01:50.263 回答