1

我正在尝试对文本格式的法律案例文档进行分类,在 Civil、Land、Criminal 等不同的文件夹中,我打算使用 Naive Bayes 作为 Vectoriser 从文本文档中获取向量,将其输入到 SVM 以分类使用 javaml 的文档,我已经实现了像词干提取这样的预处理,我使用了http://eprints.nottingham.ac.uk/2995/1/Isa_Text.pdf中所见的朴素贝叶斯公式来计算先验概率、可能性、证据和后验概率,我假设后验概率是要输入 SVM 的向量,但我无法格式化输出以输入 SVM 库。

我需要我能得到的所有帮助,我希望我做对了。

我有其他法律案例作为我想分类到正确类别的测试集。

4

0 回答 0