0

我正在训练 mahout naive-bayes 分类器。我的训练数据具有以下性质:

 Sports --> "text from different languages but related to sports"
 Health --> "text from different languages but related to health"

在这种情况下,mahout 会支持英语以外的数据吗?或其他语言文本将被忽略。

4

1 回答 1

2

是和不是。分类器很乐意对任何字符串进行操作,并且不会为它们分配意义。语言无关紧要。但是,它绝不会理解“体育”和“驱逐出境”在不同语言中是同一个词。

于 2013-03-21T10:02:44.050 回答