tensorflow - 具有 1000 类编码的 TensorFlow 分类标签

Question

我在 Tensorflow 中遇到多类分类问题。标签是字符串类型，具有 1000 个唯一值。如何编码？

如果我直接将其作为标签传递，则会出现此错误

ValueError: Labels dtype should be integer Instead got <dtype: 'string'>.

score 2 · Accepted Answer

你没有提供任何代码，所以我不知道你实际上在哪里传递标签。但我可以给出一个笼统的答案。

在具有已知类别数量的分类问题中，您只需为每个类别分配一个整数。因此，在您的情况下，您可以创建一个 python 字典，它将您的单词映射到一个整数，如下所示：

word_to_index = {'word1': 0, 'word2': 1, 'word3': 2}
label = 'word2'
index = word_to_index[label]

从您提出问题的方式和您得到的错误（它说integer）来看，在我看来，您使用的 API 只需要这样的整数。

1 回答 1