4

我需要关于如何分析此类数据的建议。我想作为机器学习工具对其进行情感分析或线性回归。预测器是分数。

color   type    make    new score

red     truck   ford    y   2
black   sedan   chevy   n   4
silver  sedan   nissan  y   5
silver  truck   nissan  n   2
black   coupe   toyota  y   1
blue    van     honda   y   1
red     truck   toyota  n   4
red     coupe   ford    n   2
black   sedan   ford    y   1
blue    truck   toyota  y   4
white   coupe   chevy   y   3
white   van     toyota  n   5
red     van     ford    y   2
silver  truck   nissan  n   3
black   sedan   honda   n   1
silver  truck   chevy   y   4
red     truck   chevy   y   5
white   coupe   honda   n   5
blue    sedan   chevy   n   2
blue    van     nissan  y   3

我可以在 WEKA 中运行一个 LinearRegression 分类器,它会产生:

score =  1.6 ( color=red,silver,white) + 1.8 (make=honda,nissan,toyota,chevy) + 0.55

但是,我想在 Django 中为 Web 应用程序实现这一点。是否有另一种方法来处理这些数据并产生不使用 WEKA 的线性回归方程。除了线性回归之外,还有其他关于如何分析它的建议吗?我已经实现了一个决策树。

4

1 回答 1

4

您可以使用scikit-learn作为您的机器学习库,尤其是它的线性回归功能这个例子也可能有用。

此外,您始终可以将 Weka java API 绑定到您的应用程序,或者自己实现线性回归,在给定矩阵代数库的情况下实现相当容易的算法。

于 2012-12-19T16:44:43.310 回答