问题标签 [anonymize]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
116 浏览

servicenow - 如何匿名存储用户提供的数据并仍然允许用户检索他们的数据?

我正在编写一个 Service Now 应用程序,它将匿名存储每个用户和日期的数据。这意味着管理员不应将记录与用户相关,但是,用户仍然应该能够看到他们的记录。

我想我需要抑制通常创建和修改的列,我打算使用工作流来解决这个问题。然后我想添加一个 ID 列来存储一些散列,但如果这是已知数据的散列(如用户 ID),任何管理员都可以轻松地对数据进行去匿名化。此外,管理员也可以恢复使用为每个用户存储的附加值。我希望这个过程尽可能简单,例如,如果用户每次交互时都必须重新输入密码,这是不可行的。理想情况下,有问题的值只有用户知道并存储在客户端上,但如果他们切换浏览器或清除 cookie,则可能会导致问题。

我很确定这是一个以前解决过的问题......

感谢您对此的任何意见!

0 投票
1 回答
55 浏览

python - 为什么我的 5 层 RSA 加密不能正常工作?解密没有返回正确的值

当我解密 5 级 RSA 加密消息时,结果不是原始消息,尽管我使用了正确的私钥和正确的私钥

我已经尝试过使用整数和加密数量。如果我只加密一次,它就可以工作

没有错误消息,但结果不是我所期望的。而不是得到正确的消息“ack”我得到一个奇怪的字符串。

0 投票
2 回答
49 浏览

python - 在 for 循环列表上替换

我的想法是在一个句子中找到每封电子邮件并将其替换为不同的随机电子邮件(匿名)。但我无法得到我想要的结果。每封电子邮件都被替换为同一封电子邮件,否则我收到错误消息(列表索引超出范围)

输入:email = "daniel@hotmail.com 发送到 ana@gmail.com"

输出我想要电子邮件 =“albert@hotmail.com 发送到 john@gmail.com”

0 投票
4 回答
72 浏览

mysql - 将 first_name 和 last_name 列中的名称截断为 1 个字符的最有效方法是什么?

将 first_name 和 last_name 列中的名称截断为 1 个字符的最有效方法是什么?

我有一个 mysql 数据库,我想将它交给开发人员,但我想对数据进行部分清理,以便两个名称记录下降到只是首字母。

我试图将 varchar 修改为 1 个字符,但 mysql 不会让我截断数据,它只会引发错误。在我交出它之前,我正在从数据库的转储中工作。我想掩盖名字而不使它们都一样。

0 投票
1 回答
540 浏览

database - Azure Database for PostgreSQL 的匿名化/数据屏蔽

是否有任何工具与Azure Database for PostgreSQL一起进行匿名化和/或数据屏蔽?

这个工作流程有没有更好的方法:

1- 通过 pg_dump 复制生产数据库(来自 Azure Database for PostgreSQL),

2- 使用 postgresql 创建 Docker 映像,使用 pg_restore 恢复数据库,使用 postgresql-anonymizer(应用数据屏蔽规则)并创建匿名转储。

目标是为 DEV/QA 提供一个匿名的生产数据库转储

谢谢你的帮助

0 投票
1 回答
166 浏览

database - 数据库匿名化:使用加性噪声

我想做一个涉及使用附加噪声来保护数据库免受推理攻击的实验。

我的数据库应该首先生成一个平均值为 25 的特定值列表,然后我将通过添加一个随机噪声值来匿名化这些值,该噪声值旨在具有 0 的预期值。

例如:我可以使用[-1,1]
范围内的均匀分布噪声或使用均值为 0的正态(高斯)噪声。

我将针对具有不同噪声的100、1000、10000 个值的数据库测试这种匿名化方法。

我对使用哪个平台以及如何使用感到困惑,所以我从 Excel 中的 10 个值开始,对于均匀分布的噪声值,我使用RAND()并添加到实际值,对于正常噪声,我使用Norm.Inv均值0,然后添加到实际值.

但是我不知道如何从黑客的角度解释数据,当我向数据集添加噪声时,当数据集变大时,我如何解释它对隐私的影响?

另外,我应该使用数据库工具来处理这个问题吗?

0 投票
0 回答
26 浏览

hash - 匿名用户上传的数据,但应保持对用户可用

我正在建立一个网站,用户可以在其中将有关其工作活动的一些数据上传到 MSSQL 数据库中。数据本身不被视为敏感信息,但如果执行活动的用户是匿名的,则它是首选。我正在使用 Google Firebase 进行身份验证,以避免必须单独构建整个用户/身份验证功能。

在匿名化数据后,任何拥有数据库访问权限的人都应该无法将数据与用户(匿名化)连接起来,但用户应该仍然能够访问他/她的信息。

我自己考虑了以下选项:

  1. 使用来自 Google 帐户的用户电子邮件创建哈希,并将其用作活动数据表中的标识符

缺点:任何有权访问数据库的人都可以使用用户的电子邮件生成相同的哈希并查找数据

  1. 让用户选择一个单独的密码/密钥作为存储在数据库中的盐并将其添加到电子邮件地址 -> 生成哈希并作为标识符存储在活动数据表中

优点:更安全,因为任何尝试将数据与用户连接的人都需要知道盐
值 缺点:与上面的第 1 点相同:有权访问数据库的人可以将用户电子邮件与盐值组合并生成哈希

  1. 让用户在每次访问他们的数据时选择一个单独的密码/密钥(不存储在数据库中)来输入。将此作为盐添加到电子邮件地址 -> 生成哈希并作为标识符存储在活动数据表中

优点:没有人无法生成相同的哈希(除非知道用户的密码/密钥)
缺点:如果用户忘记了他/她的密码/密钥,则数据将无法恢复

我敢肯定还有另一种更好/更智能(希望很简单)的方式我没有想到。欢迎所有建议。

0 投票
1 回答
262 浏览

r - 使用 R 的关系表中的数据屏蔽

我试图以不损害参照完整性的方式屏蔽数据。

我的表客户有以下数据:

客户表

产品表

现在我想屏蔽客户表中的 Product_ID(比如说)。当我屏蔽它时,转换为995 => xyz876 => pqr

现在应该对 Product 表应用相同的屏蔽,否则我将不知道特定 customer_id 的 product_Name。

我尝试使用基于摘要库的解决方案。如果我屏蔽字母数字,它可以工作,但是对于整数它不适用。

对于屏蔽/匿名,它使用以下代码:

你能告诉我这是为什么吗?是否有任何最近的屏蔽包可以在这样做时保持参照完整性?

我想到的另一个包是匿名器,但它看起来只将几列视为敏感的,并且在屏蔽时将数字转换为字母数字。

我正在尝试从一个 DBMS 系统(一些相关的表)复制数据,匿名化某些列上的数据,同时保持关系并放入其他 DBMS 系统。

0 投票
0 回答
89 浏览

python - 使用密码创建散列字符串以匿名数据?

假设我有一个包含以下数据的文本文件:

是否有一种算法或方法可以传递连接的名字和姓氏,使用出生年份作为密码来为每一行生成一个加密字符串。

假设的预期输出:

这样我可以匿名化每一行的数据。即使有人获得了加密字符串,如果没有正确的年份(密码),也可以生成所有可能的字符串,但在测试所有年份之前它不会是一个有意义的名称。

我研究过 AES 和加密算法,但它们只需要一个密码,而且它们很长而且过大。

我可以编写自己的函数/来解决这个问题,但如果已经有一个库可以完成这样的工作,我想知道。到目前为止我还没有找到。

如果可能的话,在 python 中寻找解决方案,但任何类型的见解都是有帮助的。

0 投票
1 回答
158 浏览

sql-server - ARX 数据匿名化工具 - SQL Server 连接和匿名化

我正在尝试使 ARX 使用hostname\instanceWindows 身份验证连接到 SQL Server 数据库。ARX 不断报告“未知的服务器主机名”。当还有一个实例名称时,我需要输入 ARX 在“服务器”中所期望的内容。

在此处输入图像描述

查看 ARX 的原因是因为我正在寻找一种能够匿名化 SQL Server 数据库的工具。

连接到 SQL Server 数据库,导入数据和模式,匿名数据,用匿名数据覆盖数据库中的数据。