我正在研究游戏的玩家流失预测模型。我有 60 天的时间序列轮数。在将时间序列提供给分类算法之前,我需要对时间序列进行规范化。
我正在考虑通过将 x 转换为 x/Max(x) 来使用 min-max 归一化。60 天时间序列中的 Max(x) 不一定能捕捉到玩家通常一天玩多少次的峰值。
但是通过将 x 转换为 (x-mean(x))/std(x) 的 z 归一化将不起作用,因为我需要保留没有播放的日子的信息为零。进行 z 归一化将 0 映射到不同的值,这使得它们无法比较。
是否有一个标准化方案不需要关于时间序列最大值的信息并且可以将 0 映射到 0?