我需要关于如何分析此类数据的建议。我想作为机器学习工具对其进行情感分析或线性回归。预测器是分数。
color type make new score
red truck ford y 2
black sedan chevy n 4
silver sedan nissan y 5
silver truck nissan n 2
black coupe toyota y 1
blue van honda y 1
red truck toyota n 4
red coupe ford n 2
black sedan ford y 1
blue truck toyota y 4
white coupe chevy y 3
white van toyota n 5
red van ford y 2
silver truck nissan n 3
black sedan honda n 1
silver truck chevy y 4
red truck chevy y 5
white coupe honda n 5
blue sedan chevy n 2
blue van nissan y 3
我可以在 WEKA 中运行一个 LinearRegression 分类器,它会产生:
score = 1.6 ( color=red,silver,white) + 1.8 (make=honda,nissan,toyota,chevy) + 0.55
但是,我想在 Django 中为 Web 应用程序实现这一点。是否有另一种方法来处理这些数据并产生不使用 WEKA 的线性回归方程。除了线性回归之外,还有其他关于如何分析它的建议吗?我已经实现了一个决策树。