问题标签 [arff]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在 ID3 决策树中选择具有属性数值的最佳节点
我有以下代码。当我的属性中没有任何数值用于选择最佳属性时,它可以正常工作。但是,当我的属性(例如年龄属性)具有数值时,我不确定应该如何修改我的代码才能工作。
这是我正在使用的数据。它采用 .arff 格式:
这也是我在网上找到的一个 arff 解析器,并且工作正常。我放在同一个目录中:
format - Transform Data with repeating attribute in each row to ARFF
I have a dataset as text file and data format is as follow,
ID: 1
Name: a
ID: 2
Name: b
ID: 3
Name: c
I want to convert this data format to be in arff format as follows
ID Name
1 a
2 b
3 c
Which tools should I use? It is a large dataset of 1GB with many rows. I got this dataset from snap.stadford.edu to practice Large data handling.
weka - 稀疏 Arff Weka 查询
我在 weka-> 中有一个关于 Sparse Arff 的查询
示例如下所示:
提前谢谢各位。
最好的问候等离子33
weka - 无法在 weka 中加载 Arff 文件
我正在尝试在 Weka 中打开 Arff,但出现两个错误。
首先,文件未被识别为“Arff 数据文件”。原因:文件过早结束读取 Token[EOL],第 3267 行。
此外,如果我单击缺少值“?”的“使用转换器”,
第二个错误是,csvloader 加载失败。原因:值数错误,读取2,预期1,读取Token[EOF],3267
该文件是:
awk - 如何将稀疏矩阵数据转换成WEKA的arff文件格式?
我有一个稀疏矩阵 .txt 文件,其中包含许多数字,但大多是 0。以下是来自此 .txt 文件的示例:
0 0 0.271178 0 0 0 0.538776 0 -0.631228 0 0 -0.501485 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.438643 0 0 0 0 0 0.287754 0 0 0 0 0 0 0 0 0 -0.498918 0 0 0 0 0 0.475561 0 0 0 0 0 0 0 0 0 0 0 0.370479 0 -0.300765 0 -1.10987 0 0 0.163637 0 0 0 0 0 0 0.304006 0 0.181697 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -0.261758 0 0 0 0.153415 0.17412 0 -0.129725 0 0.17598 0 0 0 06 0 0 0 0 0 0. -0.211302 0 0 0 0 0 0 0 0。213277 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0698458 0 0 0 0.661972 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.376654 0 0 -0.604655 0 0 0 0 0 0.301025 0 0 -0.431324 0 0 -0.139445 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.404718 0.610013 -0.286108 0 0.46045 0 0 0 0 0 0 -0.193543 0 0 0 0 0 0 0 0.315063 0 0 -0.285598 0 0 0.206607 0139445 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.404718 0.610013 -0.286108 0 0.46045 0 0 0 0 0 -0.193543 0 0 0 0 0 0 0 0.3150013 0 0 -0.28139445 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.404718 0.610013 -0.286108 0 0.46045 0 0 0 0 0 -0.193543 0 0 0 0 0 0 0 0.3150013 0 0 -0.28
我需要做的是能够遍历这个文件并将数据转换为WEKA 可 识别的文件格式 .arff,这样我就可以在数据集上运行数据挖掘算法。有谁知道如何做到这一点?我在 StackOverflow 上发现了一些与我的问题类似的问题,但是,它们使用的是 AWK 语言的脚本,而我以前从未使用过 .awk 程序,所以我无法让这些程序正确运行。以下是这些帖子的链接: 1 2
csv - ARFF 文件的“数据”部分可以使用空格而不是逗号吗?
我有一个大型数据集,其表格形式的属性如下
我需要将这些值输入到 ARFF 文件的数据部分,以便使用 weka 软件进行机器学习分析。但是arff支持的正常格式如下
属性以逗号分隔。arff 是否总是需要逗号,或者可以用空格或制表符分隔它吗?
java - 无法用 Weka 预测类(使用 java 代码)
我正在尝试我的文件test1.txt
,test1.model
使用下面的代码,我的类{Business,Friends,Spam}
在函数classify()
编译时,它没有预测任何类。我是 Weka 的新手,所以我发现类的类型是错误的,所以我尝试了其他类型,但它导致相同的输出和classify()
剂量没有以正确的方式编译。谁能告诉我有什么问题?
输出显示如下
使用此代码
csv - 将 .txt 文件转换为 arff
我有一个文本文件(.txt),其中每一行都有一条推文。每条推文都由新行分隔。我想将文件加载到 WEKA,但它只支持 .arff 作为输入。我打算使用一些聚类方法对推文进行聚类,那么如何将文本文件转换为 arff.
这是数据的屏幕截图。
cluster-analysis - 如何在 Weka 中为高维向量创建 ARFF 文件?
我有想要使用 Weka 进行聚类的高维(200 维)向量。我应该如何以 ARFF 格式表示它?
数据是这样的(dim1、dim2 等是实数):
矢量标签 dim1 dim2 dim3 ...... dim200
此处的链接 - http://weka.wikispaces.com/ARFF+%28stable+version%29告诉我,我应该将其表示如下:
等等。
这个对吗?我问的原因是链接并没有真正清楚地说明关于高维向量的任何内容,但我觉得可能有更好的方式来表示它们,我不知道。
machine-learning - Arff 到 SVM 灯
我创建了一个 weka arff,我想将其转换为 SVMLight 格式。这样我就可以在MLComp中加载 arff 了。如何转换 arff?