0

我在 Google Cloud Platform 上使用自然语言模块,更具体地说是使用 AUTOML 进行文本分类。当我完成导入数据并且文本已被处理时,我遇到了这个我不明白的错误:

错误:数据集的注释规范过多,允许的最大数量为 5000。

这是什么意思?你已经得到了吗?

谢谢

4

2 回答 2

0

查看AutoML Quotas & Limits文档以更好地理解。

您似乎正在触及每个数据集标签的最高限制。检查AutoML 限制--> 每个数据集的标签 --> 2 - 5000(用于分类)。

考虑到限制,与配额不同,不能增加。

于 2021-01-12T12:00:14.733 回答
0

当我确定我的标签数量低于 5000 时,我也遇到了这个错误。结果是我的 CSV 格式有错误。

当您在 Pandas 中使用 to_csv() 创建文本数据时,它只会引用包含逗号的文本数据部分,而 AutoML Text 则希望您引用文本的所有行。我已经在这个 Stackoverflow 答案中编写了解决方案

于 2021-12-09T05:33:59.480 回答