数据屏蔽是匿名化的同义词,还是匿名数据的几种方法之一?我读了很多关于它的书,但现在我有点困惑。也许是因为人们将其用作同义词,或者确实如此。
问问题
196 次
1 回答
1
数据屏蔽不是数据匿名化的同义词。
数据匿名化正在使数据无法唯一映射到给定实体。
这是相当困难的,因为即使在将大多数数据匿名化技术应用于给定数据集之后,如果数据中某些元素之间的关系仍然存在,这些可以与其他非匿名数据集结合使用,以将数据与给定实体关联起来当原始数据集没有直接的实体关联手段时。
数据屏蔽是一种用于尝试数据匿名化的技术,特别是数据扰动类型的尝试。
数据匿名化中使用的其他技术包括
- 数据聚合(从旧数据中生成新的汇总数据,这会直接或通过数据关系导致实体关联精度的损失
- 数据缩减(从数据集中删除数据,无论是基于记录还是基于变量,或者通过重新编码该变量或变量组合,以确保直接或通过数据关系丢失实体关联精度)
- 数据扰动(修改数据集中的数据)
- 合成微数据(基于旧数据集的一些统计属性但具有完全合成数据的完整新数据集的生成)
此处提供了其他参考资料。
于 2012-03-10T06:08:07.437 回答