0

我正在构建一个分析平台,我对一些事情感到困惑。

客户C在分析/客户保留平台上识别用户,external-id他们通过 SDK 向他们发送一个唯一的,基本上后面跟着一个事件流,所有这些事件都映射到该external-id.

  • 事件经过聚合、延迟或后台处理以生成多组数据,例如:
    • 每个用户的会话活动(会话数,平均会话持续时间)
    • 每个客户的活跃用户(上期 P)C
    • 更多客户端/系统范围的统计信息。

当一个用户被删除时,他的统计数据是否可以被删除/处理,这样如果他们可能再次识别(这可能会很快发生)他以前的统计数据都不会显示/可以归因于他(GDPR)?并且具有相同外部 ID(延迟或新)的即将发生的事件得到正确处理?

客户端范围的统计信息(如(活跃用户))不会受到删除的影响,如何保持完整?

请记住,有关已删除用户的事件可能会延迟出现、出现故障,或者某些后台作业可能正在等待执行与他的数据相关的操作。

我对分析平台如何处理此类案例更感兴趣?

这些平台是否保留一个内部标识符来代表用户,以帮助在用户被删除/再次注册时保持用户数据的分离?如果是,这是否意味着通过流的每个用户跟踪事件都需要一个伪internal-id = lookup(external-id)来查找用户internal-id并用它标记跟踪事件,以及这在性能方面听起来如何

请原谅问题的长寿。

4

0 回答 0