我正在使用线性回归模型研究 Weka。我意识到,通过将数据集中的两个相关属性相乘并将其添加为额外属性,我可以提高线性回归的性能。但是,我不明白为什么!为什么我将两个相关属性相乘会有更好的结果。
问问题
497 次
1 回答
1
这表明您正在逼近的函数在原始输入中不是线性的,而是在他们的乘积中。实际上,您已经重新发明了多元多项式回归。
例如,假设您要逼近的函数的形式为y = a × x ² + b × x + c。仅适用于x的线性回归模型不会给出好的结果,但是当您同时输入x ² 和x时,它可以学习正确的 a和b。
在多元设置中也是如此:一个函数在x 1和x 2中可能不是线性的,但它可能在x 1 × x 2中,您称之为“交互属性”。(我知道这些是叉积特征或特征连接;它们是 SVM 中的多项式内核计算的内容,这就是 SVM 比线性模型更强大的学习者的原因。)
于 2012-10-23T21:09:55.940 回答