Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我指的情节可以在这里找到。它是通过调用 calc_feature_statistics 函数来重现的。
我很清楚蓝色和橙色曲线(平均目标和平均预测)代表什么。红线是什么(不同特征值的预测)?
从链接:
为了计算它,特征的值被连续更改为落入每个输入对象的每个桶中。图表上一个桶的值被计算为当它们的特征值被改变为落入这个桶时所有对象的平均值。
据我了解这些词的解释如下:
例如,您有具有三个可能值的分类特征:“莫斯科”、“伦敦”、“纽约”。然后:
让我们将训练数据中此特征的所有值设置为“莫斯科”,并使用我们之前训练的模型计算所有数据的平均预测值。这将是桶“莫斯科”的红线点
使用值 'London' 重复上一步 --> 这将是桶 'London' 的红线点