2

我正在对阿拉伯语进行情感分析,我想创建自己的语料库,为此,我从 facebook 收集 300 个状态并将它们分为正面和负面,现在我想做这些状态的标记化,为了获得单词列表,然后生成单字和双字,三字并使用交叉折叠验证,我目前正在使用 nltk python,该软件是否能够执行阿拉伯语或 rapis 的任务Minner 会更好地工作,你怎么看,我想知道如何生成二元组、三元组和使用交叉折叠验证,有什么想法吗?

4

1 回答 1

0

嗯,我觉得rapidminer很有意思,可以处理这个任务。它包含几个处理文本挖掘的运算符。此外,它还允许创建具有高流畅性的新运算符。

于 2013-03-10T07:00:21.353 回答