1

我希望屏蔽数据,但可以了解有多少人在 UNIVERSITY_1 学习。

我可以使用什么去识别转换来完成此类信息\文本屏蔽?

输入:

{
    "students": [
        {
            "name": "John Smith",
            "university": "University of Pennsylvania"
        },
        {
            "formattedName": "Mike Miller",
            "university": "Harvard University"
        },
        {
            "formattedName": "Elon Musk",
            "university": "University of Pennsylvania"
        }
    ]
}

输出:

{
    "students": [
        {
            "name": "John Smith",
            "university": "UNIVERSITY_1"
        },
        {
            "formattedName": "Mike Miller",
            "university": "UNIVERSITY_2"
        },
        {
            "formattedName": "Elon Musk",
            "university": "UNIVERSITY_1"
        }
    ]
}
4

2 回答 2

1

您可以使用单个字典项(每所大学 1 个)创建自定义信息类型,并使用信息类型转换进行替换 - 您的数据集中有多少所学校?

于 2020-12-09T22:29:03.043 回答
0

您可以使用加密哈希:https ://cloud.google.com/dlp/docs/deidentify-sensitive-data#cryptohashconfig

于 2020-12-09T23:05:02.190 回答