问题标签 [google-cloud-dlp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-cloud-platform - 如何在使用 Data Loss Prevention 取消识别的文本内容中保留换行符?
我正在使用 API 调用content.deidentify
对文本内容进行去标识化。它按预期工作,但换行符被剥离。
API 调用
输入
输出
我可以在请求中添加任何选项以保留换行符吗?
我setPrettyPrint
在 Java 客户端文档中找到了。直接调用 API 时可以使用该选项吗?
google-cloud-platform - Data Loss Prevention 在屏蔽电子邮件时发现多余的实体
我正在调用 DLP API 以使用以下请求以文本形式屏蔽人名和电子邮件地址:
要求
API 调用
回复
请求(仅文本)
响应(仅文本)
输入文本包含人名和电子邮件地址。两者都按预期检测和屏蔽。但是,(person)
在被屏蔽的电子邮件地址之前和之后会添加额外的标签。
这是一个非常简单的示例,但我在以这种方式处理的每个文档中都观察到了这种行为。
为什么多次检测到人员实体?
python - Python GCP API 无法读取环境值
GOOGLE_APPLICATION_CREDENTIALS
使用 win shell开发 DLP 客户端和设置。
API 失败并带有以下签名:
google.auth.exceptions.DefaultCredentialsError: File "XXXXX.json" was not found.
在使用代码中设置时
os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "XXXXX.json"
它工作正常。
操作系统使用 Windows 10。
任何人都可以解释原因吗?
更新
- 我确实从 pycharm 终端设置了环境变量。
- 我正在从 pycharm 终端运行代码:
python my_code.py
- 当我 print(os.environ["GOOGLE_APPLICATION_CREDENTIALS"]) 我得到我设置的值。
google-cloud-platform - Google Cloud DLP 使用确定性加密重新识别 PII 数据
我正在尝试使用 Google 提供的文章 to re-identify Credit Card Number using Deterministic encryption using AES-SIV
因此,我创建了一个谷歌 DLP 模板来对数据进行去标识化,并且在模板的测试选项中,如果我们提供一个带有正确标题名称的 3 行 csv [我正在使用记录类型模板],它就可以工作
根据提供的以下链接和视频,可以使用相同的模板将数据重新识别回原始数据
“Cloud DLP 可以使用没有代理注释的 RecordTransformation 对整个列执行去标识化和重新标识化。”
https://cloud.google.com/dlp/docs/pseudonymization#cryptographic-hashing
但是当我们尝试相同时,它会再次将其重新编码为新编码的值,如下所示。
请让我知道我做错了什么以及如何使用 AES-SIV 成功使用确定性加密重新识别 PII
注意:这是我在继续阅读前面的文章时遇到的相同行为,并且在博客中没有按预期工作以重新识别数据
https://cloud.google.com/solutions/validating-de-identified-data-bigquery-re-identifying-pii-data
google-cloud-platform - 如何在数据泄露预防(谷歌云平台)去识别模板中使用自定义信息类型?
我正在使用数据泄漏预防(GCP)开发 PII de 识别应用程序。我正在为去识别规则使用去识别模板。
问题:我无法弄清楚如何在去标识化模板中使用自定义信息类型。
这是一个示例去标识化模板:
在上面的示例中,它是一个 bultin 信息类型(电子邮件),并且在文档中自定义信息类型片段如下所示:
去识别模板的剩余文档没有有效的对象定义inspect_config
,它仅在检查模板中有效。
是否可以在识别模板(infoTypeTransformations
)中使用自定义信息类型?
这是其余文档的链接。
python - 使用 Google Cloud DLP 存储的信息类型并获得 400 Invalid built-in info type name
我的 DLP 仪表板上有一个处于就绪状态的存储信息类型。它的名字是Federal_Income_Tax
。
使用https://cloud.google.com/dlp/docs/concepts-infotypes上的 python 示例,我看到以下内容:
我已将其更改为查找我存储的信息类型
我还提供了我的 google_application_credentials 和一个活动项目 ID。
调用时返回400 Invalid built-in info type
name Federal_Income_Tax
。
表示我希望使用存储的信息类型而不是内置信息类型的语法是什么?
google-cloud-dlp - Google DLP 中的文本字典转换
我希望屏蔽数据,但可以了解有多少人在 UNIVERSITY_1 学习。
我可以使用什么去识别转换来完成此类信息\文本屏蔽?
输入:
输出:
google-cloud-platform - 我们可以将使用云 KMS 密钥生成的打包密钥保存在 DLP 去识别模板中(使用 Python Api)吗?
我正在做一个 PII 去识别项目并使用谷歌云的数据丢失防护 api。
用例:使用云 KMS 密钥加密字段。
- 创建了一个 dlp-deidentification 模板,这里是片段:
将模板保存为 JSON 文件。
当我尝试使用 构建模板
python Api
时,出现以下错误:
TypeError: Cannot set google.privacy.dlp.v2.KmsWrappedCryptoKey.wrapped_key [base64-encoded]: [base64-encoded] has type <class 'str'>, but expected one of: (<class 'bytes'>,) for field KmsWrappedCryptoKey
我们如何在 json 中写入字节?不确定可行性
我使用的解决方法:
- 使用临时加密密钥创建了一个模板:
- 在 DLP UI 中修改了模板配置。
- 将密码字段的转换更改为 KMS 包装的加密密钥。
- 添加了资源名称和 KMS 生成的密钥。
- 它工作正常,测试了模板。
补充观察:
- 我做了一个 API 调用来检查配置,在我使用 UI 添加 KMS 密钥后,我看到了这样的包装密钥:
据我所知,它不可能在 json 中使用这种格式的包装密钥。
有没有办法使用保存为 json 的模板来使用 KMS 密钥?
node.js - 如何使用 Cloud DLP 将网址列入白名单?
我使用 Cloud DLP 来识别敏感数据,但我希望允许(白名单)一些数据,以便 DLP 无法识别它们。
例如,默认情况下我想匹配 URL infoType 以便 DLP 识别它。但我也想允许来自 google.com 和 yahoo.com 的某些 URL。我怎么能做到这一点?
我正在使用 Node.js 客户端库:https ://cloud.google.com/dlp/docs/libraries#using_the_client_library
google-cloud-dlp - 错误:在 KmsWrappedCryptoKey 中,“crypto_key_name”:必须来自位置“全局”
我正在尝试使用 GCP 中的控制台中的 DLP 创建一个去标识化模板。使用数据流模板从 gcs 中选择 csv 数据并加载到 BigQuert 中。
当我在全局位置创建 Cryptokey 并也在 Global 中创建去识别模板时,它成功地加密了 csv 数据并在 BigQuery 中加载。对于加密密钥和去识别模板的其他组合,总是在数据流中出错。因为“PERMISSION_DENIED:无权访问请求的去识别模板。”
此外,当在 Global 中创建模板并从 Global 以外的其他位置使用密钥时,我在创建模板本身时收到以下错误。错误:在 KmsWrappedCryptoKey 中,“crypto_key_name”:必须来自位置“全局”。
我的问题是我们不能使用在全球以外的任何地区创建的 crpto 密钥和模板吗?
谢谢