1

我是 Weka 的新手!

我的目的是将现有文章分为 2 类:教育或娱乐。

我已经有 400 篇教育类文章和 400 篇娱乐类文章。

那么如何为 Weka 创建 arff 输入文件呢?或者 Weka 的任何其他解决方案?

(对不起我的英语不好,谢谢)

4

2 回答 2

0

本文介绍如何将 CSV 格式转换为 ARFF,前提是您的数据集为 CSV 格式。

但是,如果您还没有数据集,则需要事先执行很多任务。

于 2013-01-28T03:36:43.103 回答
0

尽管这似乎是一段漫长的旅程,但您实际上可以做到。您尝试做的一切都与文本挖掘的主题有关。我想你可以从这个链接中学到很多东西。此外,我认为可能对您有用的信息是:

  1. 首先,在每个文本表单中打开您的文件并将其粘贴到电子表格程序(例如 Excel)中的一行中。在其旁边的列中,输入文档类型(教育或娱乐)。您总共将有 800 行。

  2. 单击 Excel 文件菜单中的“另存为”,然后选择文件类型为“.csv”。并将其保存为“.csv”。(在“Excel”中单击“保存”后,他询问您是否要将工作簿保存为“Excel”。我认为“否”。

  3. 在“Weka”中打开“.csv”文件: 在“Weka”中选择“打开文件”,将文件类型标记为 .csv,然后选择“.csv”文件。

  4. 从“过滤器 -> 选择”列表中选择“StringToVector”。您可以检查此地址以进行必要的参数设置。

  5. 您将使用 Weka 中的“保存”命令获得所需的“.arff”格式文件。

StringToVector_in_Weka

我希望它有所帮助。祝你好运。

于 2020-07-10T12:59:09.350 回答