问题标签 [arff]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
605 浏览

python - 在 ID3 决策树中选择具有属性数值的最佳节点

我有以下代码。当我的属性中没有任何数值用于选择最佳属性时,它可以正常工作。但是,当我的属性(例如年龄属性)具有数值时,我不确定应该如何修改我的代码才能工作。

这是我正在使用的数据。它采用 .arff 格式:

这也是我在网上找到的一个 arff 解析器,并且工作正常。我放在同一个目录中:

0 投票
2 回答
98 浏览

format - Transform Data with repeating attribute in each row to ARFF

I have a dataset as text file and data format is as follow,

ID: 1

Name: a

ID: 2

Name: b

ID: 3

Name: c

I want to convert this data format to be in arff format as follows

ID Name

1 a

2 b

3 c

Which tools should I use? It is a large dataset of 1GB with many rows. I got this dataset from snap.stadford.edu to practice Large data handling.

0 投票
1 回答
176 浏览

weka - 稀疏 Arff Weka 查询

我在 weka-> 中有一个关于 Sparse Arff 的查询

示例如下所示:

提前谢谢各位。

最好的问候等离子33

0 投票
1 回答
4454 浏览

weka - 无法在 weka 中加载 Arff 文件

我正在尝试在 Weka 中打开 Arff,但出现两个错误。

首先,文件未被识别为“Arff 数据文件”。原因:文件过早结束读取 Token[EOL],第 3267 行。

此外,如果我单击缺少值“?”的“使用转换器”,

第二个错误是,csvloader 加载失败。原因:值数错误,读取2,预期1,读取Token[EOF],3267

该文件是:

https://www.dropbox.com/s/xs0ssnvs42bik5c/sg.arff

0 投票
2 回答
1086 浏览

awk - 如何将稀疏矩阵数据转换成WEKA的arff文件格式?

我有一个稀疏矩阵 .txt 文件,其中包含许多数字,但大多是 0。以下是来自此 .txt 文件的示例:

0 0 0.271178 0 0 0 0.538776 0 -0.631228 0 0 -0.501485 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.438643 0 0 0 0 0 0.287754 0 0 0 0 0 0 0 0 0 -0.498918 0 0 0 0 0 0.475561 0 0 0 0 0 0 0 0 0 0 0 0.370479 0 -0.300765 0 -1.10987 0 0 0.163637 0 0 0 0 0 0 0.304006 0 0.181697 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -0.261758 0 0 0 0.153415 0.17412 0 -0.129725 0 0.17598 0 0 0 06 0 0 0 0 0 0. -0.211302 0 0 0 0 0 0 0 0。213277 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0698458 0 0 0 0.661972 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.376654 0 0 -0.604655 0 0 0 0 0 0.301025 0 0 -0.431324 0 0 -0.139445 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.404718 0.610013 -0.286108 0 0.46045 0 0 0 0 0 0 -0.193543 0 0 0 0 0 0 0 0.315063 0 0 -0.285598 0 0 0.206607 0139445 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.404718 0.610013 -0.286108 0 0.46045 0 0 0 0 0 -0.193543 0 0 0 0 0 0 0 0.3150013 0 0 -0.28139445 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.404718 0.610013 -0.286108 0 0.46045 0 0 0 0 0 -0.193543 0 0 0 0 0 0 0 0.3150013 0 0 -0.28

我需要做的是能够遍历这个文件并将数据转换为WEKA 可 识别的文件格式 .arff,这样我就可以在数据集上运行数据挖掘算法。有谁知道如何做到这一点?我在 StackOverflow 上发现了一些与我的问题类似的问题,但是,它们使用的是 AWK 语言的脚本,而我以前从未使用过 .awk 程序,所以我无法让这些程序正确运行。以下是这些帖子的链接: 1 2

0 投票
1 回答
883 浏览

csv - ARFF 文件的“数据”部分可以使用空格而不是逗号吗?

我有一个大型数据集,其表格形式的属性如下

我需要将这些值输入到 ARFF 文件的数据部分,以便使用 weka 软件进行机器学习分析。但是arff支持的正常格式如下

属性以逗号分隔。arff 是否总是需要逗号,或者可以用空格或制表符分隔它吗?

0 投票
0 回答
401 浏览

java - 无法用 Weka 预测类(使用 java 代码)

我正在尝试我的文件test1.txttest1.model使用下面的代码,我的类{Business,Friends,Spam} 在函数classify()编译时,它没有预测任何类。我是 Weka 的新手,所以我发现类的类型是错误的,所以我尝试了其他类型,但它导致相同的输出和classify()剂量没有以正确的方式编译。谁能告诉我有什么问题?

输出显示如下

使用此代码

0 投票
1 回答
2813 浏览

csv - 将 .txt 文件转换为 arff

我有一个文本文件(.txt),其中每一行都有一条推文。每条推文都由新行分隔。我想将文件加载到 WEKA,但它只支持 .arff 作为输入。我打算使用一些聚类方法对推文进行聚类,那么如何将文本文件转换为 arff.

这是数据的屏幕截图。 在此处输入图像描述

0 投票
2 回答
390 浏览

cluster-analysis - 如何在 Weka 中为高维向量创建 ARFF 文件?

我有想要使用 Weka 进行聚类的高维(200 维)向量。我应该如何以 ARFF 格式表示它?

数据是这样的(dim1、dim2 等是实数):

矢量标签 dim1 dim2 dim3 ...... dim200

此处的链接 - http://weka.wikispaces.com/ARFF+%28stable+version%29告诉我,我应该将其表示如下:

等等。

这个对吗?我问的原因是链接并没有真正清楚地说明关于高维向量的任何内容,但我觉得可能有更好的方式来表示它们,我不知道。

0 投票
1 回答
539 浏览

machine-learning - Arff 到 SVM 灯

我创建了一个 weka arff,我想将其转换为 SVMLight 格式。这样我就可以在MLComp中加载 arff 了。如何转换 arff?