2

我有一个由 100 个 txt 文件组成的数据集,所有这些文件都包含在一个名为 Z 的文件夹中,我想将它们转换为 ARFF 格式。我正在使用 Weka 工具。

我以两种方式做到了这一点,但在这两种方式中我都得到了一个空的 ARFF 文件。

第一种方式:通过 weka 中包含的简单 CLI,使用以下命令:

java weka.core.converters.TextDirectoryLoader -dir D:\Z > D:\ss.arff

第二种方式:通过 GUI 尝试使用上述相同的转换器加载文件。

==========================注意:文件是文本格式“.txt”,但它们实际上包含数字而不是字符


有什么办法可以解决这个问题,如果有人可以提供帮助或支持,我将不胜感激。

谢谢和最好的问候,穆罕默德

4

2 回答 2

0

我遇到了同样的问题。我使用 CLI 使用以下命令进行转换:java weka.core.converters.TextDirectoryLoader -dir A:\train > A:\train。我得到了空的 .arff 文件。我在 .txt 文件中准备好内容。我将 .txt 文件中的内容复制到 .arff 文件并保存。它对我有用。

于 2014-04-30T06:40:10.557 回答
0

Checkout the github repository

https://github.com/jeroenjanssens/data-science-at-the-command-line

and use the csv2arff tool.

Example:

< /home/knut/R/x86_64-pc-linux-gnu-library/3.1/knitr/misc/tweak_bib.csv 
csv2arff  
> tweak_bib.csv.arff

csv2arff is a very simple bash script. I recommend to check out the repository because you should also use csv2arff in conjunction with the loading script data-science-at-the-command-line/tools/weka supplied with this book/repo. The script then loads weka.jar.

Last time I checked, the csv2arff, or rather the class core.converters.CSVLoader did not work properly with weka 3.7.

....

just checking

....

OK. It works with weka 3.8.

You should set an environment variable WEKAPATH to the directory which contains your weka.jar.

于 2016-08-14T10:23:54.170 回答