weka - 使用 WEKA 进行主题识别

翻译自：https://stackoverflow.com/questions/13337920 2012-11-12T03:14:34.753

202 次

1

我对数据挖掘和 WEKA 工具领域完全陌生（今天刚刚安装）。

我需要根据短文本句子进行主题识别。

假设我有几个类别： - 政治 - 体育 - 其他

我正在考虑执行以下操作：列出我将文本与之比较的术语列表：

运动的：
- 美国国家橄榄球联盟
- NBA
- 触地
- ETC
政治：
- 选举
- 总统
- 奥巴马
- ETC

另外，我想添加更多类别。

然后我会在 WEKA 的帮助下应用一些算法 SVM 或朴素贝叶斯。

关于如何使用 WEKA 开始执行此操作的任何想法？

我已经搜索了一些关于 WEKA 的教程，但我似乎找不到任何与我正在尝试做的类似的例子。

任何帮助我启动将不胜感激。

0 回答 0