我是机器学习的新手。我目前想要的是对某些单词是否属于某个类别进行分类..
让我更具体地说,在输入一些单词时,我需要检查这些单词是否属于称为“马拉雅拉姆语”的语言。
示例:enthayi ninakk sugamanno?
这些是一些用英语表达的马拉雅拉姆语单词。在给出这样的输入时,它需要检查经过训练的数据,如果任何输入词属于“马拉雅拉姆语”类别,那么它需要显示它是马拉雅拉姆语。
我试图做的..
我尝试使用 NaiveBayesClassifier 对其进行分类,但它始终显示所有输入数据的积极响应。
train = [
('aliya','Malayalam')]
cl = NaiveBayesClassifier(train)
print cl.classify('enthayi ninakk sugamanno')
但是打印语句给出了输出“马拉雅拉姆语”