背景:我们的服务有遥测系统,想跟踪留存率、有多少用户使用各种功能等。
有两种选择可以处理用户身份信息并符合 GDPR:
- 支持根据请求删除用户信息
- 将数据保留少于 30 天
选项 #1 难以实施(对于遥测系统)。选项 #2 不允许回答诸如“什么是功能 X 的 6 个月保留期?”之类的问题。
如何获得上述问题的答案的一个想法是每周/每天计算每个功能的 HyperLogLog blob,并将它们永远分开存储。这将允许基于这些 blob 继续合并/dcount/计算保留。
假设任何用户可识别信息在 30 天后消失(在用户帐户被删除后),HyperLogLog blob 是否仍允许跟踪用户(即回答特定用户是否在两年前使用功能 X)?
如果它允许,那么它是不合规的(如果它不允许,并不意味着它是合规的)。