问题标签 [google-cloud-dlp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
35 浏览

google-cloud-platform - 如何在使用 Data Loss Prevention 取消识别的文本内容中保留换行符?

我正在使用 API 调用content.deidentify对文本内容进行去标识化。它按预期工作,但换行符被剥离。

API 调用

输入

输出

我可以在请求中添加任何选项以保留换行符吗?

setPrettyPrint在 Java 客户端文档中找到了。直接调用 API 时可以使用该选项吗?

0 投票
1 回答
110 浏览

google-cloud-platform - Data Loss Prevention 在屏蔽电子邮件时发现多余的实体

我正在调用 DLP API 以使用以下请求以文本形式屏蔽人名和电子邮件地址:

要求

API 调用

回复

请求(仅文本)

响应(仅文本)

输入文本包含人名和电子邮件地址。两者都按预期检测和屏蔽。但是,(person)在被屏蔽的电子邮件地址之前和之后会添加额外的标签。

这是一个非常简单的示例,但我在以这种方式处理的每个文档中都观察到了这种行为。

为什么多次检测到人员实体?

0 投票
1 回答
77 浏览

python - Python GCP API 无法读取环境值

GOOGLE_APPLICATION_CREDENTIALS使用 win shell开发 DLP 客户端和设置。

API 失败并带有以下签名:

google.auth.exceptions.DefaultCredentialsError: File "XXXXX.json" was not found.

在使用代码中设置时

os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "XXXXX.json"它工作正常。

操作系统使用 Windows 10。

任何人都可以解释原因吗?

更新

  1. 我确实从 pycharm 终端设置了环境变量。
  2. 我正在从 pycharm 终端运行代码:python my_code.py
  3. 当我 print(os.environ["GOOGLE_APPLICATION_CREDENTIALS"]) 我得到我设置的值。
0 投票
1 回答
483 浏览

google-cloud-platform - Google Cloud DLP 使用确定性加密重新识别 PII 数据

我正在尝试使用 Google 提供的文章 to re-identify Credit Card Number using Deterministic encryption using AES-SIV

https://cloud.google.com/solutions/creating-cloud-dlp-de-identification-transformation-templates-pii-dataset#creating_a_key_encryption_key_kek

因此,我创建了一个谷歌 DLP 模板来对数据进行去标识化,并且在模板的测试选项中,如果我们提供一个带有正确标题名称的 3 行 csv [我正在使用记录类型模板],它就可以工作

DLP 模板

DLP 模板测试

根据提供的以下链接和视频,可以使用相同的模板将数据重新识别回原始数据

“Cloud DLP 可以使用没有代理注释的 RecordTransformation 对整个列执行去标识化和重新标识化。”

https://cloud.google.com/dlp/docs/pseudonymization#cryptographic-hashing

但是当我们尝试相同时,它会再次将其重新编码为新编码的值,如下所示。

DLP 模板重新识别不起作用

请让我知道我做错了什么以及如何使用 AES-SIV 成功使用确定性加密重新识别 PII

注意:这是我在继续阅读前面的文章时遇到的相同行为,并且在博客中没有按预期工作以重新识别数据

https://cloud.google.com/solutions/validating-de-identified-data-bigquery-re-identifying-pii-data

0 投票
2 回答
266 浏览

google-cloud-platform - 如何在数据泄露预防(谷歌云平台)去识别模板中使用自定义信息类型?

我正在使用数据泄漏预防(GCP)开发 PII de 识别应用程序。我正在为去识别规则使用去识别模板。

问题:我无法弄清楚如何在去标识化模板中使用自定义信息类型。

这是一个示例去标识化模板:

在上面的示例中,它是一个 bultin 信息类型(电子邮件),并且在文档中自定义信息类型片段如下所示:

去识别模板的剩余文档没有有效的对象定义inspect_config,它仅在检查模板中有效。

是否可以在识别模板(infoTypeTransformations)中使用自定义信息类型?

这是其余文档的链接

0 投票
1 回答
81 浏览

python - 使用 Google Cloud DLP 存储的信息类型并获得 400 Invalid built-in info type name

我的 DLP 仪表板上有一个处于就绪状态的存储信息类型。它的名字是Federal_Income_Tax

使用https://cloud.google.com/dlp/docs/concepts-infotypes上的 python 示例,我看到以下内容:

我已将其更改为查找我存储的信息类型

我还提供了我的 google_application_credentials 和一个活动项目 ID。

调用时返回400 Invalid built-in info typename Federal_Income_Tax

表示我希望使用存储的信息类型而不是内置信息类型的语法是什么?

0 投票
2 回答
20 浏览

google-cloud-dlp - Google DLP 中的文本字典转换

我希望屏蔽数据,但可以了解有多少人在 UNIVERSITY_1 学习。

我可以使用什么去识别转换来完成此类信息\文本屏蔽?

输入:

输出:

0 投票
1 回答
272 浏览

google-cloud-platform - 我们可以将使用云 KMS 密钥生成的打包密钥保存在 DLP 去识别模板中(使用 Python Api)吗?

我正在做一个 PII 去识别项目并使用谷歌云的数据丢失防护 api。

用例:使用云 KMS 密钥加密字段。

  • 创建了一个 dlp-deidentification 模板,这里是片段:
  • 将模板保存为 JSON 文件。

  • 当我尝试使用 构建模板python Api时,出现以下错误:

TypeError: Cannot set google.privacy.dlp.v2.KmsWrappedCryptoKey.wrapped_key [base64-encoded]: [base64-encoded] has type <class 'str'>, but expected one of: (<class 'bytes'>,) for field KmsWrappedCryptoKey

我们如何在 json 中写入字节?不确定可行性

我使用的解决方法:

  • 使用临时加密密钥创建了一个模板:
  • 在 DLP UI 中修改了模板配置。
  • 将密码字段的转换更改为 KMS 包装的加密密钥。
  • 添加了资源名称和 KMS 生成的密钥。
  • 它工作正常,测试了模板。

补充观察:

  • 我做了一个 API 调用来检查配置,在我使用 UI 添加 KMS 密钥后,我看到了这样的包装密钥:

在此处输入图像描述

据我所知,它不可能在 json 中使用这种格式的包装密钥。

有没有办法使用保存为 json 的模板来使用 KMS 密钥?

0 投票
1 回答
110 浏览

node.js - 如何使用 Cloud DLP 将网址列入白名单?

我使用 Cloud DLP 来识别敏感数据,但我希望允许(白名单)一些数据,以便 DLP 无法识别它们。

例如,默认情况下我想匹配 URL infoType 以便 DLP 识别它。但我也想允许来自 google.com 和 yahoo.com 的某些 URL。我怎么能做到这一点?

我正在使用 Node.js 客户端库:https ://cloud.google.com/dlp/docs/libraries#using_the_client_library

0 投票
1 回答
160 浏览

google-cloud-dlp - 错误:在 KmsWrappedCryptoKey 中,“crypto_key_name”:必须来自位置“全局”

我正在尝试使用 GCP 中的控制台中的 DLP 创建一个去标识化模板。使用数据流模板从 gcs 中选择 csv 数据并加载到 BigQuert 中。

当我在全局位置创建 Cryptokey 并也在 Global 中创建去识别模板时,它成功地加密了 csv 数据并在 BigQuery 中加载。对于加密密钥和去识别模板的其他组合,总是在数据流中出错。因为“PERMISSION_DENIED:无权访问请求的去识别模板。”

此外,当在 Global 中创建模板并从 Global 以外的其他位置使用密钥时,我在创建模板本身时收到以下错误。错误:在 KmsWrappedCryptoKey 中,“crypto_key_name”:必须来自位置“全局”。

我的问题是我们不能使用在全球以外的任何地区创建的 crpto 密钥和模板吗?

谢谢