我是 Weka 的新手!
我的目的是将现有文章分为 2 类:教育或娱乐。
我已经有 400 篇教育类文章和 400 篇娱乐类文章。
那么如何为 Weka 创建 arff 输入文件呢?或者 Weka 的任何其他解决方案?
(对不起我的英语不好,谢谢)
我是 Weka 的新手!
我的目的是将现有文章分为 2 类:教育或娱乐。
我已经有 400 篇教育类文章和 400 篇娱乐类文章。
那么如何为 Weka 创建 arff 输入文件呢?或者 Weka 的任何其他解决方案?
(对不起我的英语不好,谢谢)
本文介绍如何将 CSV 格式转换为 ARFF,前提是您的数据集为 CSV 格式。
但是,如果您还没有数据集,则需要事先执行很多任务。
尽管这似乎是一段漫长的旅程,但您实际上可以做到。您尝试做的一切都与文本挖掘的主题有关。我想你可以从这个链接中学到很多东西。此外,我认为可能对您有用的信息是:
首先,在每个文本表单中打开您的文件并将其粘贴到电子表格程序(例如 Excel)中的一行中。在其旁边的列中,输入文档类型(教育或娱乐)。您总共将有 800 行。
单击 Excel 文件菜单中的“另存为”,然后选择文件类型为“.csv”。并将其保存为“.csv”。(在“Excel”中单击“保存”后,他询问您是否要将工作簿保存为“Excel”。我认为“否”。
在“Weka”中打开“.csv”文件: 在“Weka”中选择“打开文件”,将文件类型标记为 .csv,然后选择“.csv”文件。
从“过滤器 -> 选择”列表中选择“StringToVector”。您可以检查此地址以进行必要的参数设置。
您将使用 Weka 中的“保存”命令获得所需的“.arff”格式文件。
我希望它有所帮助。祝你好运。