3

通过以下链接,我有了一些想法。我想问我是做对了还是我做错了。如果我走错了路,请指导我。

使用libsvm
进行文本分类 c#
如何使用 libsvm 进行文本分类?

我的方式

首先计算每个训练集中的单词数
为每个单词创建一个映射列表

例如

sample word count form training set
|-----|-----------|
|     |   counts  |
|-----|-----|-----|
|text | +ve | -ve |
|-----|-----|-----|
|this | 3   | 3   |
|forum| 1   | 0   |
|is   | 10  | 12  |
|good | 10  | 5   |
|-----|-----|-----|

正向训练数据

this forum is good

训练集也是

+1 1:3 2:1 3:10 4:10

这一切都是我从上面的链接中收到的。
请帮我。

4

2 回答 2

4

你做对了。

我不知道为什么你的 laben 被称为“+1” - 应该是一个简单的整数(参考文档“+ve”),但总而言之,这是要走的路。

对于文档分类,您可能需要查看专为处理大量功能而设计的 liblinear。

于 2012-05-26T18:33:00.340 回答
0

你也可以从这里使用 libshorttext: libshortText

在蟒蛇

于 2014-01-28T13:45:10.273 回答