2

在 pySpark MLlib 中似乎无法保存和加载回归模型,例如 LogisticRegressionModel、SVMModel、NaiveBayesModel 和 DecisionTreeModel。通过 JavaSaveable 和 JavaLoader mixins 对推荐模型MatrixFactorizationModel进行加载和保存,但回归模型不是这样完成的。

有没有办法通过提供我自己的负载和保存程序来解决这个问题?如果是这样,我将如何处理?

这个功能是否会在未来的版本中出现,或者 pySpark MLlib 是否会被逐步淘汰?

4

1 回答 1

0

在 Spark 1.3.1 中,LinearModel作为大多数线性分类器(即LogisticRegressionModel)的基类的类是纯 Python 类,因此您可以尝试腌制它,或者您可以自己保存属性_coeff - weights()_intercept - intercept()构造传递权重和截距项的LogisticRegressionModel类,如下例所示:

model = LogisticRegressionModel(weights, intercept)
于 2015-04-20T04:55:22.550 回答