我声明一个 CD 文件用于从以下位置读取它:
pool = Pool(features_file, CDfile)
其中 CDfile 包含文本和 <\t> 分隔符:
0 Target
1 Categ cat_reg
97 Categ cat_dow
98 Categ cat_nweek
99 Categ cat_month
100 Categ cat_hour
101 Categ cat_is_month_start
102 Categ cat_is_year_end
103 Categ cat_is_year_start
104 Categ cat_anomaly2016
我有这样的结果: 第 102 列和第 1 行中的因子 False 被声明为数字并且不能被解析为浮点数。尝试更正列描述文件。
这是整个功能的切片= DataFrame()
len(cat_features),len(features.columns)9 105
cat_columns cat_positions values
cat_reg 1 1075
cat_dow 97 5
cat_nweek 98 17
cat_month 99 4
cat_hour 100 1
cat_is_month_start 101 False
cat_is_year_end 102 False
cat_is_year_start 103 False
cat_anomaly2016 104 0
第 102 列有什么问题?为什么将其声明为数字(非分类)特征?