我在 Google Big Query 中有一个包含一些敏感字段的表。我阅读并了解了有关数据检查的内容,但找不到直接在 BigQuery 数据库中使用 DLP API 编辑数据的方法。
两个问题:
- 是否可以仅使用 DLP API 来做到这一点?
- 如果不是,那么在运行到 TB 的表中修复数据的最佳方法是什么?
我在 Google Big Query 中有一个包含一些敏感字段的表。我阅读并了解了有关数据检查的内容,但找不到直接在 BigQuery 数据库中使用 DLP API 编辑数据的方法。
两个问题:
API 尚不支持直接对 bigquery 进行去标识化。
但是,您可以编写一个利用 content.deidentify 的数据流管道。如果您使用 Table 对象(https://cloud.google.com/dlp/docs/reference/rest/v2/ContentItem#Table)批处理您的行,这可以非常有效地工作。