1

我想使用 svm light 进行分类。

在其网站上的示例中,文件格式为:

<line> .=. <target> <feature>:<value> <feature>:<value> ... <feature>:<value> # <info>
<target> .=. +1 | -1 | 0 | <float> 
<feature> .=. <integer> | "qid"
<value> .=. <float>
<info> .=. <string>

我无法理解这种格式。linevalue指的是什么?这是示例训练集的一部分:

1 6:0.0198403253586671 15:0.0339873732306071 29:0.0360280968798065 31:0.0378103484117687 41:0.0456787263779904 63:0.021442413608662 74:0.0813238108919922 75:0.0201048944012214 81:0.0603996615380116 142:0.0102897706466067 172:0.0777948548082322 174:0.072717200608936 179:0.054076743737027 180:0.0764456665578607 186:0.112586705083256 187:0.0925011727805475 205:0.156990770998115 229:0.0519505660963924 255:0.0923321093879611 308:0.0732972342194965 318:0.119740882706743 408:0.058414185072804 409:0.0506626198519805 465:0.0843545829662396 480:0.0729642744872502 519:0.118611296605205 664:0.112142083701314 679:0.374387819227881 720:0.0987664035972632 768:0.123975200617516 922:0.141018083523918 977:0.136393581474495 1018:0.107648758381437 1305:0.180449632267364 1581:0.141526866911118 1677:0.156124608446181 1817:0.141018083523918 2162:0.170921341813635 2314:0.164249324532582 2358:0.508349039100422 2419:0.150582824316425 3266:0.338899359400281 3374:0.166725496161846 8311:0.219691455487068

我知道在第一行数据1中指的是正输出,6请参考target. target参考一个word。并0.0198403253586671参考value。但我不知道这value:0.0198403253586671 是如何计算的。

4

2 回答 2

0

第 1 行:一行是目标,后跟特征值对列表和一些注释 第 2 行:目标是一或负一或零或浮点数 第 3 行:特征是整数等等。它是所有可能输入的语法。

于 2014-04-13T19:56:00.267 回答
0

我正在使用 SVMLIght 进行情绪分析。是根据文档中术语的value频率计算得出的。

于 2014-04-20T02:00:19.300 回答