我有训练集和测试集(带有标题的 csv 文件),我必须在其中对每个值进行分类。X 列有 118.000 个 uniq 值,而 y1 列只有大约 13000 个,因此将有 13000 个类别。
从训练集中我只需要X
和y1
列来训练模型。我需要将 X 值分类为类别之一(从初始单词中找到正常值)。我尝试了所有多重算法,但未能尝试评估模型。
可视化分数模型返回:
可能是什么问题,它只是返回 -2 代码作为错误和此日志
UPD1:通过项目列模块下的元数据编辑器模块将 y1 列为分类,似乎没有任何改变