-2

我正在从事数据挖掘项目,我必须设计以下模型。

我给出了 4 个特性 x1、x2、x3 和 x4 以及在这些上定义的四个函数

功能,使得每个功能都依赖于可用功能的某个子集。

例如

F1(x1, x2) =x1^2+2x2^2

F2(x2, x3) =2x2^2+3x3^3

F3(x3, x4) =3x3^3+4x4^4

这意味着 F1 是一些依赖于特征 x1、x2 的函数。F2 是一些依赖于 x2、x3 等的特征

现在我有一个可用的训练数据集,其中 x1,x2,x3,x4 的值已知并且 sum(F1+F2+F3) {我知道总和但不知道函数的单个总和)

现在使用这些训练数据,我必须制作一个可以正确预测所有函数总和的模型,即(F1+F2+F3)

我是数据挖掘和机器学习领域的新手。所以如果这个问题太琐碎或错误,我提前道歉。我试图以多种方式对其进行建模,但我对此没有任何清晰的想法。我将不胜感激有关此的任何帮助。

4

1 回答 1

1

Your problem is non-linear regression. You have features

x1 x2 x3 x4 S where (S = sum(F1+F2+F3) )

You would like to predict S using Xn but S function is non-linear. Since your function S is non linear, you need to use a non-linear regression algorithm for this problem. Normal nonlinear regression may solve your problem or you may choose other approaches. You may for example try Tree Regression or MARS (Multivariate Adaptive Regression Splines). They are well known algorithms and you can find commercial and open source versions.

于 2013-11-06T07:08:12.080 回答