问题标签 [google-cloud-dlp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
250 浏览

google-cloud-dlp - 如何对大查询表中存在的数据进行去标识化

如何去识别大查询表中已经存在的数据,然后重新识别相同的数据并加载到其他 BQ 表中。

谢谢

0 投票
1 回答
55 浏览

google-cloud-dlp - 自定义信息类型和启动指令规则

尝试将 customInfoType 与 hotwordRule 结合使用。配置如下所示(取自nodeJS实现):

自定义信息类型:

自定义规则集:

在这里inspectConfig

运行它时,我得到:

当我customeRuleSet从运行配置中删除它时,它通过了,但没有识别字符串。所以它必须与该proximity部分做一些事情,但不确定是什么问题。

0 投票
1 回答
39 浏览

python - Google Cloud DLP 常规自定义字典错误“字典没有“cloudStoragePath”字段”

在 DLP 中,我正在创建一个常规的自定义字典检测器,它指向存储在 Cloud Storage 中的字典文本文件。以下是我为定义 custominfotype 所做的工作。我相信它遵循https://cloud.google.com/dlp/docs/creating-custom-infotypes-dictionary#examples上的说明。然而,它与“协议消息字典没有“cloudStoragePath”字段错误。该文本文件肯定存在于我的云存储桶中,并且我拥有适当的凭据。你能告诉我我的语法是否错误吗?谢谢你。

0 投票
1 回答
141 浏览

google-cloud-dlp - Google Cloud DLP 支持哪些自然语言?

我正在考虑使用 Cloud DLP 来帮助我匿名化我的数据。但是,我似乎无法明确提及支持哪些语言。AWS Comprehend 的检测 PII API 仅支持英语,因此正在寻找替代方案。

0 投票
1 回答
41 浏览

python-3.x - 不允许使用 GCP DLP 对图像类型 PNG 进行去标识化

我收到此错误:google.api_core.exceptions.InvalidArgument: 400 BytesType.IMAGE_PNGis not supported for use with de-identification。

我有这个代码,它应该适用于图像,但后来我收到这个错误,说明它不受支持。我做错了什么或相信错误吗?这个错误是否可能是由于我处于试用期?

0 投票
1 回答
94 浏览

google-cloud-platform - 使用 GCP DLP 和 DataFusion,找不到模板

我在 Project X 中创建了一个名为 DLPTest 的 DLP 标识模板。
我的 Datafusion 资源托管在 Project Y 中。
问题是当我在 Datafusion 中使用 Redact 插件时,并在表单中提供模板 ID 或路径 -
projects/X/locations/ {LOCATION}/inspectTemplates/DLPTest 或
projects/X/inspectTemplates/DLPTest
所有权限均已提供给数据融合 SA、计算引擎 SA、DLP 服务帐户。Datafusion 找不到模板,因为它一直在 Project Y 中搜索模板。
> 错误日志 - > 原因:com.google.api.gax.rpc.InvalidArgumentException: io.grpc.StatusRuntimeException: INVALID_ARGUMENT: Invalid path:
Datafusion is在位置项目/Y/inspectTemplates/projects/DLPTest 中期待模板
如何让 DF 在单独项目中的正确位置查找模板?谢谢。
0 投票
1 回答
41 浏览

google-cloud-dlp - 来自 bigquery 表的 DLP 数据扫描显示 row_index 为空

我从 Google DLP 控制台扫描了一个 Bigquery 表。扫描结果被保存回一个大查询表中。DLP 已识别出敏感信息,但 row_index 显示为空“location.content_locations.record_location.table_location.row_index”,谁能帮我理解为什么?

0 投票
1 回答
47 浏览

google-cloud-dlp - Google DLP 是否可以在不处理澳大利亚以外其他地区的数据的情况下使用

我们正在尝试为我们的公司创建一个 DLP 平台,并且需要知道我们是否可以调用 DLP API 并获得结果,而无需实际将文档保存在澳大利亚境外。

0 投票
1 回答
258 浏览

node.js - 通过使用 Cloud Data Loss Prevention 检查 BigQuery 数据来创建数据目录列标签

我想使用 DLP 在 BigQuery 中检查我的表,然后将结果写入表列上的策略标签。例如,我有一个(测试)表,其中包含个人的电子邮件地址和电话号码等数据。我可以使用 DLP 来查找这些字段并将它们识别为电子邮件和电话号码,我可以在控制台中或通过 API(我正在使用 NodeJS)执行此操作。创建此检查作业时,我知道我可以将其配置为自动将结果写入数据目录,但这会在table上生成标签,而不是在列上。我想用已识别的特定类型的 PII 标记列。

我发现这个教程似乎完全实现了这一点——但教程是一个强有力的词;它是一个用 Java 编写的脚本,是对该脚本作用的基本解释,唯一的实际说明是克隆 git 存储库并运行一些命令。没有关于正在进行哪些 API 调用的信息,代码中没有很多注释,也没有指向相关文档的链接。我对 Java 的经验为零,因此我无法解决该过程并将其转换为 NodeJS 以用于我自己的目的。

我还发现了这个类似的教程,它也使用了 Dataflow,并且说明只是“克隆这个 repo,运行这个脚本”。我已包含该链接,因为它提供了一个屏幕截图,显示了我想要实现的目标:使用 DLP 找到的 PII 数据标记列

所以,我想做的似乎是可能的,但我在任何地方都找不到有用的文档。我已经阅读了 DLP 和数据目录文档,以及 NodeJS 的 API 参考。如果有人可以帮助我弄清楚如何做到这一点,我将不胜感激。

更新:我取得了一些进展并因此改变了我的方法。

DLP 提供了两种检查数据的方法:dlp.inspectContent()dlp.createDlpJob()。后者需要一个可以是 BigQuery 表的 storageItem,但它不会返回有关结果中列的任何信息,所以我不相信我可以使用它。

inspectContent() 不能在 BigQuery 表上运行;它可以检查结构化文本,这是我上面链接的 Java 脚本所使用的;该脚本正在查询 BigQuery 表,并根据结果构造一个,然后将该表传递给 inspectContent(),然后返回一个包含字段名的结果对象。我想这样做,但是在 NodeJS 中。我正在努力将 BigQuery 结果转换为 Table 的格式,因为 NodeJS 似乎没有该类型的构造函数,就像 Java 那样。

0 投票
1 回答
46 浏览

google-cloud-platform - 是否可以在 GCS 中的一组文件上运行数据流 DLP 去识别作业?

我在一个文件夹中有大量 csv 文件,我需要在这些文件上运行去识别化作业,并且想知道是否有人知道我可以在文件夹/多个文件上运行该作业的任何方式?目前,我正在使用 DLP 模板创建数据流作业,这对于单个数据集来说效果很好。我知道在 GCS 中,您可以在其中包含多个文件的文件夹上运行 DLP,但您只能使用检查模板而不是去识别模板。

将它们放入存储桶也不是一种选择,因为父文件夹已经是存储桶并且无法嵌套存储桶。

任何帮助将不胜感激谢谢