我正在尝试使用 SVMLight 构建一个分类器来检测名词短语(NP)是否是照应。我有我的特点,但我一直在理解输入文件的格式,我应该将我的所有文本翻译成这种格式,还是只放代表正面实例和负面实例的 NP。是否有任何软件可以让我将文件翻译成这种格式。
<line> .=. <target> <feature>:<value> <feature>:<value> ... <feature>:<value> # <info>
<target> .=. +1 | -1 | 0 | <float> //for positive instance should I put +1
<feature> .=. <integer> | "qid" //should I do this line for all my feature
<value> .=. <float>
<info> .=. <string> //Should this contain the NP
另外,对于模型文件,这个文件应该包含什么?
您的帮助将不胜感激。