java - 在槌中使用带有朴素贝叶斯分类器的 svmlight 样式数据

Question

我有几个问题要问
1) 在 svmlight 样式的数据中有（目标特征：值特征：值 ...）我知道是什么feature，value但它是什么target？这是什么意思？我想知道这一点，因为我计划制作一个将这些数据写入其中的文本文件。

2）在一个文件中还有多行（目标特征：值特征：值）每行代表一个文档吗？假设我有 50 个文档，那么每一行代表一个文档？

3）在我用存储在其中的数据制作这个文本文件之后svmlight-style，我想将它传递到Naive Bayes Classifierin MALLET. 这将如何解决？

score 1 · Accepted Answer

根据官方 SVMLight 网站，训练集由行组成

<line> .=. <target> <feature>:<value> <feature>:<value> ... <feature>:<value> # <info>

其中每一行定义如下：

<target> .=. +1 | -1 | 0 | <float> 
<feature> .=. <integer> | "qid"
<value> .=. <float>
<info> .=. <string>

“在分类模式下，目标值表示示例的类别。目标值+1表示正例，-1表示负例。因此，例如，行

-1 1:0.43 3:0.12 9284:0.2 # abcdef

指定一个负例，其中特征编号 1 的值为 0.43，特征编号 3 的值为 0.12，特征编号 9284 的值为 0.2，所有其他特征的值为 0。此外，字符串 abcdef 与向量一起存储，它可以作为为用户定义的内核提供附加信息的一种方式。类别标签 0 表示该示例应使用转导进行分类。通过转导分类的示例的预测被写入通过 -l 选项指定的文件。预测的顺序与训练数据中的顺序相同。"

有关详细信息，请参阅官方网站http://svmlight.joachims.org/。

java - 在槌中使用带有朴素贝叶斯分类器的 svmlight 样式数据

1 回答 1

Related

Reference