我在 NLP 中有一项任务是训练分类器并将其导出为人类可读的格式。这样做的最佳应用程序是什么。
我尝试使用 NLTK,但是它没有导出为人类可读格式的功能,例如
这是一个分类器
classifier = nltk.NaiveBayesClassifier.train(train_set)
我需要它来保存并稍后用于我自己的需要,而无需与 NLTK 有任何联系
我知道泡菜把戏,但它并不是完全可读的。
用于训练分类器并将其导出到文件的最佳和舒适工具是什么?
我在 NLP 中有一项任务是训练分类器并将其导出为人类可读的格式。这样做的最佳应用程序是什么。
我尝试使用 NLTK,但是它没有导出为人类可读格式的功能,例如
这是一个分类器
classifier = nltk.NaiveBayesClassifier.train(train_set)
我需要它来保存并稍后用于我自己的需要,而无需与 NLTK 有任何联系
我知道泡菜把戏,但它并不是完全可读的。
用于训练分类器并将其导出到文件的最佳和舒适工具是什么?
看来您并不真正了解您要做什么。如果我理解正确 - 你想看看你训练的模型/分类器的工作有多精确。
在这种情况下,您不应该关心您使用什么类型的软件包,而是部署什么算法。这意味着你不应该使用所谓的黑盒算法,例如神经网络、贝叶斯……尝试使用决策树(例如 J48)——它会给你一个指导(人类可读的)知识如何这是工作。
xhudik 是正确的。贝叶斯将成为一种黑盒算法,但如果我正确理解您的意图——您可能想了解某些单词/特征输入的系数,为什么不直接浏览模型?即使使用朴素贝叶斯,您也可以检查分类器输出的似然值并将其序列化到文件中。
示例:您有 3 个班级:A、B 和 C
A B C
n1 -> .2 .6 .2
n2 -> .5 .1 .4
.
.
.