问题标签 [google-cloud-dlp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
63 浏览

google-cloud-platform - GCP 的 Cloud DLP 是否也保护 GCP Cloud Source Repositories 中的数据?

GCP 的DLP API 页面有一个简短的描述,即“为文本、图像和谷歌云平台存储库中的隐私敏感片段提供检测、风险分析和去识别化方法。”

我想知道 GCP Cloud Source Repositories 是否算作 Google Cloud Platform 存储库。

让我知道。

谢谢!

问候, 尤瓦

0 投票
2 回答
75 浏览

rest - Google DLP - 使用 InfoTypes.list() 显示区域

集成 Google DLP API 后,ListInfoTypes() 当前返回信息类型参考中存在的信息类型的名称、描述和支持的类型。是否也可以将“澳大利亚”或“阿根廷”等信息类型的区域作为单独的字段获取?

目前这是我的输出:

我也需要区域,例如 Region: "Australia" 用于其他所有信息类型。

我也四处看看locations.infoTypes.list(),但我不确定我应该在过滤器中输入哪个位置以获得任何值。

0 投票
1 回答
106 浏览

google-cloud-platform - 数据目录中的 Google Cloud DLP 标记显示为待处理的作业状态?

我首先在 DLP 中创建了一个自定义模板(带有自定义检测器),然后使用新的 DLP 模板针对 BQ 表创建了一个 DLP 作业,并使用发布到数据目录设置运行该作业。

DLP 作业已完成,但数据目录中的 DLP 标记的作业状态为待处理...仅当我为 DLP 作业使用自定义模板时才会发生这种情况。

如果我使用开箱即用的 DLP 检测器标签,则会正确显示数据目录。知道为什么自定义 DLP 模板结果未显示在数据目录中吗?

这是数据目录中 BQ 表条目的列表标记的 o/p

0 投票
1 回答
33 浏览

google-cloud-platform - 使用 FPE Primitive Transform 去识别并忽略某些字符

有没有办法让去识别 DLP 忽略某些字符?目前,使用包含“-”符号的自定义字母表加密电子邮件最终加密如下。理想情况下,加密文本都将采用“XXX-XX-XXXX”格式,我注意到可以进行 CharsToIgnore 调用,但不确定将其放在哪里......可能是调用的 API 中的元数据字段(deidentify_content?)或在其他地方。

谢谢!

  • 325-7959452
  • 31424943-6
0 投票
1 回答
90 浏览

google-cloud-dlp - Google Cloud DLP API:默认安全通信

我们正在使用 java 库com.google.cloud:google-cloud-dlp进行 Google Cloud DLP 调用。在客户端,我们使用DlpServiceClient。我知道它在内部使用gRPC。想知道默认通信是否使用SSL/TLS

0 投票
3 回答
429 浏览

python - 对于谷歌 DLP 的 deidentify_with_fpe() Python API 包装器,需要通过哪些参数?

我正在研究此处提供的 google cloud dlp api 文档,特别是这个问题是关于deidentify_with_fpe().

我的问题是需要通过函数传递以返回匿名数据的参数的格式是什么。我现在的代码是

在哪里

并且mysecret.txt.encrypted是由该命令在终端中生成的

当 google-token.txt 从这里生成时。

我在调用时遇到的错误deidentify_with_fpe('My name is john smith', ['FIRST_NAME'])如下:

这是一个直接原因:

所以我认为我的问题与密钥有关——在它被加密之前。我无法在文档中看到如何获取该密钥或如何将其传递到函数中。

我很欣赏这是一个漫长而冗长的提交,任何回复都将不胜感激,我花了太长时间试图做到这一点,感觉我快要让它发挥作用了

0 投票
1 回答
2379 浏览

python-3.x - 使用 GCP DLP API 获得 403 权限被拒绝

我正在编写一个 Python 脚本来检查谷歌云存储中存在的一些文件的内容,如果它们包含一些 PII。脚本如下

我在文档中读到 DLP API 使用所需的权限集创建了自己的服务帐户。

启用 Cloud DLP 后,服务帐号会添加到项目中。

为了通过 JobTrigger 访问 Google Cloud 资源并执行对 Cloud DLP 的调用,Cloud DLP 使用 Google API 服务帐户的凭据向其他 API 进行身份验证。Google API 服务帐户专门设计用于代表您运行内部 Google 流程。可以使用电子邮件识别服务帐户:

服务-[PROJECT_NUMBER]@dlp-api.iam.gserviceaccount.com

当我运行代码时,我收到一个 403 错误,指出它没有所需的权限 dlp.jobs.create。我更新了帐户的 IAM 策略以包含具有以下提到的策略集的自定义角色(因为这只是一个用于学习目的的项目)。

  1. 我的服务帐户有两个单独的权限集:

    • DLP 权限单独:
    • dlp.jobs.create
    • dlp.jobs.cancel
    • dlp.jobs.delete
    • dlp.jobs.get
    • dlp.jobs.list
  2. 所有者权限,因此它可以不受限制地访问所有谷歌资源。

    • 角色/所有者

但是,当我现在运行脚本时,它仍然给出以下错误:

0 投票
2 回答
204 浏览

regex - GCP - DLP - 正则表达式

尝试使用 RegEx 种类的自定义信息类型处理 BigQuery 表。

我正在使用的正则表达式:^(\d{5})$

在下表中,我尝试仅针对5 位数字的“代码”进行标记。使用上面的 RegEx,有 0 个匹配项。

使用以下正则表达式:\d{5}

它匹配所有5 位数字的实例(包括其他中的两个)

我如何获得它以使其仅与“单元格”(?)开头的 5 位数字匹配并以第 5 位数字结尾?非常感谢,被这个困住了。

0 投票
1 回答
187 浏览

google-cloud-platform - GCP DLP 无法运行 dlp.deidentify_content 方法获取异常请求涉及位置“us-east1”,但已发送到位置“全球”

我在以下代码中调用方法 dlp.deidentify_content。KeyRing 在区域 us-east1 中制作,并且使用 HSM 生成密钥。GCP 不允许为全局密钥环生成 HSM 密钥。

当我运行代码时,我得到了错误,

google.api_core.exceptions.NotFound:404 解包 KmsWrappedCryptoKey “projects/PROJ_NAME/locations/us-east1/keyRings/dlp-test3/cryptoKeys/key7”时从 Cloud KMS 收到以下错误消息:请求涉及位置 'us-east1 ' 但被发送到位置'全球'。阅读 go/storky-stubby 了解更多信息。

我无法弄清楚如何从特定区域发送请求。理想情况下,我希望将密钥环设为全局。但是,GCP 不允许 HSM 密钥用于全局密钥环,因此无法为该密钥提供 Wrapped_key。

有人可以建议如何克服错误吗?

0 投票
1 回答
631 浏览

python - GCP DLP(数据丢失预防)得到“解密失败:密文无效。”

我正在用 Python 实现 Google Cloud Platforms-Data Loss Prevention API 的标准实现,用于去识别文本。这是来自https://github.com/GoogleCloudPlatform/python-docs-samples/blob/master/dlp/deid.py中deidentify_with_fpe方法的示例

当我使用下面提到的参数运行代码时,出现以下错误。

有人可以建议如何解决错误吗?

整个轨迹是

我正在传递以下参数

  • 项目=project_id
  • string="我的 SSN 是 372819127"
  • info_types=["US_SOCIAL_SECURITY_NUMBER"]
  • 字母=“数字”
  • surrogate_type=无

对于 key_name,我以格式传递参数(这里的项目名称被屏蔽)

传递的换行文本在以下参数中,关键字符被屏蔽

这是代码片段