0

商业案例:现场燃料消耗预测。

假设油耗 C,取决于各种因素 x1,x2,...xn。所以从数学上讲,C = F{x1,x2,...xn}。我没有任何方程式可以说明这一点。

我确实有历史数据集,从中我可以得到 C 与 x1,x2 .. 等的相关性。C,x1,x2,.. 都是定量的。对于像我这样统计知识有限的人,对于变量方程,找出相关性似乎很困难。

所以,我正在考虑使用一些有监督的机器学习技术。我将使用历史数据训练分类器,以预测下一次消费。

问题:我的想法是否正确?问:如果这是正确的,我的系统应该是一个不断发展的系统。因此,我将向系统提供的真实数据越多,这将改进我的模型,以便下次做出更好的预测。这是一个正确的理解吗?

如果上述陈述属实,那么 Mahout 中的 AdaptiveLogisticRegression 算法对我有帮助吗?

在这里向专家寻求建议!

提前致谢。

4

1 回答 1

1

好的,相关性不是预测模型。相关性只是基于协方差将数据集之间的某种关系归因于。

为了开发预测模型,您需要执行的是回归。

最简单的回归形式是线性单变量,其中 C = F (x1)。这可以在 Excel 中轻松完成。但是,您声明 C 是多个变量的函数。为此,您可以使用线性多元回归。有可以执行此操作的标准包(例如在 Excel 中),或者您可以使用 Matlab 等。

现在,我们假设 C 和 X 的分量(输入向量)之间存在“线性”关系。如果关系不是线性的,那么您将需要更复杂的方法(非线性回归),这很可能会采用机器学习方法。

最后,一些系列表现出自相关。如果是这种情况,那么您可能会忽略 C = F(x1, x2, x3...xn) 关系,而是使用时间序列技术(例如 ARMA 等)直接对 C 函数本身进行建模复杂的变体。

我希望这会有所帮助,Srikant Krishna

于 2013-01-30T19:13:48.043 回答