0

我有训练集测试集(带有标题的 csv 文件),我必须在其中对每个值进行分类。X 列有 118.000 个 uniq 值,而 y1 列只有大约 13000 个,因此将有 13000 个类别。

在此处输入图像描述

从训练集中我只需要Xy1列来训练模型。我需要将 X 值分类为类别之一(从初始单词中找到正常值)。我尝试了所有多重算法,但未能尝试评估模型。

可视化分数模型返回:

在此处输入图像描述

可能是什么问题,它只是返回 -2 代码作为错误和此日志

UPD1:通过项目列模块下的元数据编辑器模块将 y1 列为分类,似乎没有任何改变

4

1 回答 1

1

Moncef在这里为我的问题提供了解决方案:

关键是 Azure 对最大类别 8192 有限制,这就是为什么应该通过 R 或 python 模块减少数量,或者可以创建自己的评估模块。或者还有另一种方式,可以跳过评估步骤,因为模型已经成功训练。

于 2015-11-23T09:44:23.193 回答