问题标签 [google-cloud-dlp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
141 浏览

google-cloud-dlp - 获取代码 3 错误:在 KmsWrappedCryptoKey 中

尝试按照示例代码通过设置 cryptoHashConfig 生成代理哈希时出现以下错误

这是使用的请求

0 投票
1 回答
203 浏览

google-cloud-dlp - 是否可以使用一个 dlpJob 检查 BigQuery 数据集中的所有表?

我正在使用 Google Cloud DLP 检查 BigQuery 中的敏感数据。我想知道是否可以使用一个 dlpJob 检查数据集中的所有表?如果是这样,我应该如何设置配置?

我试图在配置中省略 BQ tableId 字段。但它会返回 http 400 错误“table_id必须设置”。是不是意味着一个 dlpJob 只能检查一张表,而要扫描多个表我们需要多个 dlpJobs?或者有没有办法用一些正则表达式技巧扫描同一个数据集中的多个表?

0 投票
1 回答
307 浏览

google-bigquery - 如何在 Google BigQuery 中编写去标识化模板

我正在尝试从 Google Cloud Services 中的 CSV 文件中识别某些列。CSV 文件包含具有 ID、FirstName、LastName、DOB 等的 10 列。我试图屏蔽 FirstName 和 LastName 字段以将它们替换为 * 字符。

我从这个链接阅读了编写去识别模板的过程。

我正在尝试使用记录转换仅屏蔽名字和姓氏字段,但是在运行作业时出现 ArrayOutOf Bounds 错误。

是否有必要我必须提及De标识模板中的所有列或仅提及我需要屏蔽的那些字段。

CSV 文件如下所示:

我使用的 Deidentfication 模板如下:

我希望输出是 BigQuery 中的一个表,其中包含屏蔽的 FirstName 和 Lastname 列。然而,我得到一个数组越界错误。

0 投票
1 回答
164 浏览

google-cloud-platform - 如果安装了 SDK,如何获取有效令牌以在本地计算机上使用 GCP Data Loss Prevention API?

现在我没有设法让用于 python 的 Google Cloud Platform Data Loss Prevention (DLP) 客户端库在 SSL 代理后面工作(它可以与其他 GCP 客户端库一起正常工作,例如用于存储或 bigquery): https://cloud .google.com/dlp/docs/libraries#client-libraries-usage-python

所以我尝试使用request.postSSL 代理背后的 API

CloudShell这在我安装的本地机器上工作正常,但不是SDK。原因在于CloudShell

在我的本地机器(Windows 或 Mac)上给我相同的令牌几分钟,每次我执行命令时,我都会得到一个新的令牌。在我的本地机器上,如果我在标头中用令牌替换 gcloud 命令,CloudShell它工作正常。我的SDK本地机器和CloudShell.

问题1:预计每次我们在gcloud auth print-access-token本地运行时(SDK),我们都会得到一个新的token?(在CloudShell几分钟内它是相同的令牌)

问题 2:生成令牌的最简单/最佳方法是什么?因为gcloud auth print-access-token在使用本地机器和SDK. 这不是一个高效的应用程序。这只是为了测试 DLP API。

0 投票
2 回答
903 浏览

python - 如何为 python 配置 Google Cloud Platform Data Loss Prevention 客户端库以在 SSL 代理后面工作?

我正在尝试让用于 python 的 Google Cloud Platform Data Loss Prevention (DLP) 客户端库在 SSL 代理后面工作: https ://cloud.google.com/dlp/docs/libraries#client-libraries-usage-python

我正在使用文档中的代码片段:

我还设置了以下 ENV 变量:

当您不在 SSL 代理后面时,它可以毫无问题地运行。当我在代理后面工作时,我正在设置 3 个 ENV 变量:

通过这样的设置,其他 GCP 客户端 python 库可以在 SSL 代理后面正常工作,例如用于存储或 bigquery)。

对于 DLP Client python lib,我得到:

我没有在文档中找到解释该库是否与代理一起作为一个 GCP 客户端库以及如何将其配置为与 SSL 代理一起使用的文档。该库处于测试阶段,因此可能尚未实现。

它似乎与 CA 证书和握手有关。BigQuery 和 Storage Client python lib 使用相同的 CA 没有问题。任何的想法 ?

0 投票
1 回答
61 浏览

google-cloud-platform - Google DLP 的文本限制

我似乎找不到去识别文本的文本大小限制

https://cloud.google.com/dlp/limits表示每个报价有 4KB 的限制。

报价是什么意思?这是否意味着一个字符串?

0 投票
1 回答
633 浏览

google-cloud-platform - 如何使用 DLP api 从存储桶 (GCS) 读取镶木地板文件并取消识别到特定列?

下面是我的 JSON 对象,用于 DLP API 调用,用于屏蔽 GCS 存储桶上 parquet 文件上的特定数据列。虽然 calli dlp.deidentify_content() 方法我必须将项目传递给它,但不确定如何传递镶木地板文件,我已经提到了镶木地板文件路径。

我想要完成的是屏蔽 GCS 存储桶上的 parquet 文件并屏蔽少数列,并将屏蔽的 parquet 文件存储为 BigQuery 表上的表。

0 投票
2 回答
405 浏览

python-3.x - “ValueError:协议消息 DeidentifyTemplate 没有 'deidentifyTemplate' 字段。”

我正在尝试使用 GCP DLP API 客户端库(Python 3)创建 DE 识别模板。我已经使用 POST 方法成功创建了去标识化模板。DE 识别模板的作用是使用 Google KMS 包装的密钥加密一些 PII 字段。

错误:

ValueError:协议消息 DeidentifyTemplate 没有“deidentifyTemplate”字段。

0 投票
1 回答
43 浏览

encryption - 如何混淆维护数据语义结构的个人信息(意大利 GDPR 法)

正如我想你们中的许多人已经做过的那样,我正面临着混淆我的数据库的个人敏感数据以进行测试操作的问题。事实上,为了执行测试或验证故障,我们会在测试环境中制作生产数据库的副本。

然而,这意味着我们携带所有客户的所有个人和敏感数据。

我们想加密数据,但结果是,如果我必须直接在数据库上工作,或者我没有转码层,加密的数据就没有用了。

所以我一直在寻找一些可以转换数据的软件,从而丢失原始数据,但可以保持其原始语义结构。

示例:John Doe -> Frek Rao 01/02/1987 -> 12/03/1986

这样我就可以在没有原始数据的情况下保留数据结构。

你有什么建议吗?

谢谢

0 投票
1 回答
376 浏览

permissions - Google DLP 用户的访问被拒绝

我正在使用具有 Google DLP 角色的服务帐户并获得:403 Not allowed, access denied for permission serviceusage.services.use 在客户拥有的帐户中。Google DLP 用户角色似乎具有 serviceusage.services.use。还有什么可能阻止成功通话?