我正在研究一个二进制分类问题,如果每个数据实例都有几个不同指标的时间序列,并且还有一些其他属性。如何处理时间序列,将它们视为单独的属性?但这会丢失与时间维度相关的信息。
为了使其更具体,训练实例的示例如下所示:
ID MetricA_Day1 MetricA_Day2 ..... MetricA_Day31 MetricB_Day1....MetricB_Day2 AttributeC AttributeD AttributeE
有没有关于如何处理这个问题的最佳实践?
我正在研究一个二进制分类问题,如果每个数据实例都有几个不同指标的时间序列,并且还有一些其他属性。如何处理时间序列,将它们视为单独的属性?但这会丢失与时间维度相关的信息。
为了使其更具体,训练实例的示例如下所示:
ID MetricA_Day1 MetricA_Day2 ..... MetricA_Day31 MetricB_Day1....MetricB_Day2 AttributeC AttributeD AttributeE
有没有关于如何处理这个问题的最佳实践?
首先,“通用”答案:不,在机器学习的最佳实践中没有这样的事情。事实上,只有坏的和当下流行的,没有“最好的”。即使对于二元线性分类,训练几何模型(SVM?)还是概率模型更好,也取决于数据。即使我们缩小到某个特定的模型(比如说神经网络),即使在数据缩放方面也没有最佳实践。它应该在[0,1]中吗?或者也许是[-1,1]?那么均值 0 和方差 1 呢?那么协方差矩阵呢?
现在了解详细信息-您的问题几乎没有提供有关数据的信息。说“我有一些属性和几个时间序列”远没有给真正有洞察力和有价值的答案的机会。但这似乎不是一项有明确答案的任务,它是一项长期研究任务。
在研究期间您可以搜索什么?