我正在熟悉Pyspark和SparkML目前。为此,我使用 Titanic 数据集来训练 GLM 以预测该数据集中的“票价”。
我正在密切关注 Spark 文档。我确实得到了一个工作模型(我称之为glm_fare),但是当我尝试使用评估训练模型时,summary我收到以下错误消息:
RuntimeError:没有可用于此 GeneralizedLinearRegressionModel 的训练摘要
为什么是这样?
训练的代码是这样的:
glm_fare = GeneralizedLinearRegression(
labelCol="Fare",
featuresCol="features",
predictionCol='prediction',
family='gamma',
link='log',
weightCol='wght',
maxIter=20
)
glm_fit = glm_fare.fit(training_df)
glm_fit.summary