0

某些类型的数据集是否无法预测?

我自己当前的现实生活示例:我的目标是为交叉销售保险产品创建一个预测模型。例如,从汽车保险到健康保险。

我的数据集主要由特征数据组成,例如他们居住的州、年龄、性别、汽车类型等......

我尝试了各种不同的模型,例如 XGboosted Trees 到正则化逻辑回归,而 AUC 不能超过 0.65。


所以这让我想到 - 某些类型的数据集不是预测性的吗?你如何帮助利益相关者理解这一点?

4

1 回答 1

0

一些数据集可能不是很有预测性。特别是如果您缺少导致大部分差异的变量。如果不与主题专家交谈,很难说是否是这种情况。话虽如此,模型很好而且很好,但我也会确保您花费大量时间来设计功能。通常,以正确方式表示数据的时间可能是工作模型和坏模型之间的区别,尤其是在树模型中。

于 2017-12-11T16:39:19.663 回答