我想在机器学习模型中使用一年中的某一天。由于一年中的这一天不是连续的(2019 年的第 365 天之后是 2020 年的第 1 天),我想按照这个链接执行循环(正弦或余弦)变换。
但是,在每一年中,新的转换变量都没有唯一值;例如,同一年的两个值为 0.5,请参见下图。我需要能够在模型训练和预测中使用一年中的某一天。对于正弦变换中的 0.5 值,它可以在 31.01.2019 或 31.05.2019 上,然后使用 0.5 值可能会使模型混淆。
是否可以使模型在同一年内区分 0.5 的两个值?
我正在使用 Maxent 软件对物种的分布进行建模。物种数据在 20 年内每天都是连续的。我需要模型来捕获当天或季节的信号,而无需将它们中的任何一个明确用作分类变量。
谢谢
编辑1 基于以下furcifer的评论。但是,我发现增量建模方法对我的应用程序没有用处。解决了后续天数一致的问题;例如 30.12.2018、31.12.2018 和 01.01.2019。但这与从某个参考日(重量 = 1)开始计算天数没有什么不同。2019 年同一日期的价值远高于 2014 年,这在生态上没有意义。我希望从所使用的日常环境条件(解释变量)中捕捉到年际变化。我需要在模型中使用天的原因是为了捕捉迁徙物种分布的季节性趋势,而没有明确使用月份或季节作为分类变量。为了预测今天合适的栖息地,