下午好,
好吧,我想执行一个多标签文本分类,所以,我选择 MEKA(Weka 的扩展)来执行这个任务。但是,我需要将文档转换为单词向量,我使用 GUI Weka 但您知道它只执行二元分类,因为我倾向于使用 MEKA 来执行此任务,问题是我如何创建 arff这里有多个标签的文件是一个例子:这是文本
FMNH(2) 添加到哈维弧菌萤光素酶在 2A°C 在十四醛的存在下导致形成与生物发光的光谱分布无法区分的高荧光瞬态物种。生物发光在 1.5 秒内达到最大强度,并以复杂的方式衰减,指数成分为 10(-1) s(-1)、7 x 10(-3)S(-1)。和 7 x10(4)s(-1)。
标签是:
“FM”、“Fl”、“Ki”、“Luc”、“Lum”、“时间因素”
我想得到的结果:
@attribute L-class {Luc, Lum, Limb,...}
@attribute F-class {FM, Fl, Foot,...}
@attribute o-class{Ki, TimeFactors, Adult, Aged, ...}
@attribute All_words 频率
@数据
FM,Fl,Ki,Luc,Lum,TimeFactors,2,4,6,8,8,7,4,0,1,2,2....
首字母缩略词是标签,数字是文本中每个术语出现的频率。有人可以帮助我,我将非常感激。