1

我在 Tensorflow 中遇到多类分类问题。标签是字符串类型,具有 1000 个唯一值。如何编码?

如果我直接将其作为标签传递,则会出现此错误

ValueError: Labels dtype should be integer Instead got <dtype: 'string'>.
4

1 回答 1

2

你没有提供任何代码,所以我不知道你实际上在哪里传递标签。但我可以给出一个笼统的答案。

在具有已知类别数量的分类问题中,您只需为每个类别分配一个整数。因此,在您的情况下,您可以创建一个 python 字典,它将您的单词映射到一个整数,如下所示:

word_to_index = {'word1': 0, 'word2': 1, 'word3': 2}
label = 'word2'
index = word_to_index[label]

从您提出问题的方式和您得到的错误(它说integer)来看,在我看来,您使用的 API 只需要这样的整数。

于 2017-12-20T15:02:59.233 回答