1

我想使用 DLP 在 BigQuery 中检查我的表,然后将结果写入表列上的策略标签。例如,我有一个(测试)表,其中包含个人的电子邮件地址和电话号码等数据。我可以使用 DLP 来查找这些字段并将它们识别为电子邮件和电话号码,我可以在控制台中或通过 API(我正在使用 NodeJS)执行此操作。创建此检查作业时,我知道我可以将其配置为自动将结果写入数据目录,但这会在table上生成标签,而不是在列上。我想用已识别的特定类型的 PII 标记列。

我发现这个教程似乎完全实现了这一点——但教程是一个强有力的词;它是一个用 Java 编写的脚本,是对该脚本作用的基本解释,唯一的实际说明是克隆 git 存储库并运行一些命令。没有关于正在进行哪些 API 调用的信息,代码中没有很多注释,也没有指向相关文档的链接。我对 Java 的经验为零,因此我无法解决该过程并将其转换为 NodeJS 以用于我自己的目的。

我还发现了这个类似的教程,它也使用了 Dataflow,并且说明只是“克隆这个 repo,运行这个脚本”。我已包含该链接,因为它提供了一个屏幕截图,显示了我想要实现的目标:使用 DLP 找到的 PII 数据标记列

所以,我想做的似乎是可能的,但我在任何地方都找不到有用的文档。我已经阅读了 DLP 和数据目录文档,以及 NodeJS 的 API 参考。如果有人可以帮助我弄清楚如何做到这一点,我将不胜感激。

更新:我取得了一些进展并因此改变了我的方法。

DLP 提供了两种检查数据的方法:dlp.inspectContent()dlp.createDlpJob()。后者需要一个可以是 BigQuery 表的 storageItem,但它不会返回有关结果中列的任何信息,所以我不相信我可以使用它。

inspectContent() 不能在 BigQuery 表上运行;它可以检查结构化文本,这是我上面链接的 Java 脚本所使用的;该脚本正在查询 BigQuery 表,并根据结果构造一个,然后将该表传递给 inspectContent(),然后返回一个包含字段名的结果对象。我想这样做,但是在 NodeJS 中。我正在努力将 BigQuery 结果转换为 Table 的格式,因为 NodeJS 似乎没有该类型的构造函数,就像 Java 那样。

4

1 回答 1

1

我无法找到实现列级标签的 node.js 文档。

但是,您可能会发现Policy Tags 官方文档有助于为您指明正确的方向。具体来说,您可能缺少一些角色来管理列级标签。

于 2021-06-10T07:49:36.013 回答