0

我正在研究游戏的玩家流失预测模型。我有 60 天的时间序列轮数。在将时间序列提供给分类算法之前,我需要对时间序列进行规范化。

我正在考虑通过将 x 转换为 x/Max(x) 来使用 min-max 归一化。60 天时间序列中的 Max(x) 不一定能捕捉到玩家通常一天玩多少次的峰值。

但是通过将 x 转换为 (x-mean(x))/std(x) 的 z 归一化将不起作用,因为我需要保留没有播放的日子的信息为零。进行 z 归一化将 0 映射到不同的值,这使得它们无法比较。

是否有一个标准化方案不需要关于时间序列最大值的信息并且可以将 0 映射到 0?

4

1 回答 1

0

您可以通过将数组中的每个值除以数组中的值的总和(归一化因子“sum to unity”)将值转换为概率。ietransform x to x./sum(x) 这会将 0 值映射到 0并且不需要关于最大值的信息。

于 2014-01-31T18:15:18.417 回答