问题标签 [arff]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2880 浏览

weka - Weka中ARFF格式的属性太多

我正在使用维度超过 10,000 的数据集。要使用 Weka 我需要将文本文件转换为 ARFF 格式,但是由于即使使用稀疏 ARFF 格式文件大小太大,属性也太多。是否有与数据类似的方法来避免在 ARFF 文件的标题中写入如此多的属性标识符。

例如:
@attribute A1 NUMERICAL
@attribute A2 NUMERICAL
...
...
@attribute A10000 NUMERICAL

0 投票
2 回答
5134 浏览

weka - 缺少值的 Weka

作为这个人,我有一个关于 weka 的问题:

大家好:

我对 WEKA 感到很奇怪。

我准备了一个包含很多缺失值的 CSV 文件。此文件中的一个缺失值是基本的,只是在一对逗号之间没有任何值,即,random_value1,,random_value2。这是格式的一个例子。您可以看到有一对逗号,它们之间没有任何东西,甚至没有空格,它应该表示数据的缺失值。

奇怪的是,当我将此 CSV 读入 WEKA 时,WEKA 会将所有缺失值分配给问号,即“?”。这正是 WEKA 的表达方式。

然后当我运行测试分析时,WEKA 开始研究这些“?” 作为某种有用的信息。它只是缺少值,WEKA 可以跳过它吗?

这些问题变得非常浪费。分析结果类似于如果缺失则值缺失,缺失与缺失相关,缺失与缺失相关。

WEKA 可以将缺失值读取为缺失值,而不是某种问号吗?或者我可以告诉 WEKA 对于所有“?”,将它们视为缺失值?

多谢你们

他使用这个解决方案解决了他的问题:

我找到了一种方法来告诉 WEKA 失踪的事情。只需使用 ASCII 编辑器的 fine_and_replace 功能,替换所有的 '?' 至 ?。

>

但我不知道如何下载 ASCII Editor 并使用它,谁能告诉我????

0 投票
1 回答
2778 浏览

java - Weka打印稀疏arff文件

我正在尝试 arff 文件的稀疏表示,如此处所示。在我的程序中,我可以打印类标签“B”,但由于某种原因它没有打印“A”。

该程序的输出就像 -

但是当我这样做时

我得到正确的输出 -

由于某种原因,它没有采用索引 0。有人可以告诉我为什么会这样吗?

0 投票
3 回答
2678 浏览

r - 在 R 中读取 arff 文件

我想使用 R 读取来自 UCI 和 Amazon 评论的数据集。

数据集采用 ARFF (.arff) 格式。

我正在使用以下脚本:

我收到以下错误

read.arff("amazon.arff") 中的错误:属性规范无效。

感谢您在高级方面的帮助。

0 投票
1 回答
1125 浏览

weka - weka 中的 ARFF 输出根据是否增量保存而有所不同

下面是一个程序,它显示了如果来自 weka 的 ARFF 保护程序以增量模式写入,字符串是如何错误输出的。如果将参数传递给程序,则以下程序以增量模式运行,如果未传递参数,则以批处理模式运行。

请注意,在批处理模式下,ARFF 文件包含字符串...正常操作。在增量模式下,ARFF 文件包含整数而不是字符串……奇怪!

关于如何让 ARFF 格式化程序以增量格式输出字符串的任何想法?

0 投票
4 回答
46761 浏览

weka - 如何从 .t​​xt 创建 .arff 文件?

有什么简单的方法可以做到这一点吗?我不是Java,我是Python新手,所以我需要另一种方式。提前致谢!

0 投票
1 回答
1635 浏览

weka - Weka 中名义属性的取值范围

我有一个名义属性可用于使用 Weka 进行数值预测。但是这个名义属性恰好有957 个可能的值(1-957)。有没有办法在ARFF 输入文件中指定它。一种明显的方法是编写一个脚本来生成1-957逗号分隔的条目。

但我只是想知道 WEKA 是否提供了任何解决方法?

0 投票
1 回答
3137 浏览

machine-learning - WEKA - arff 格式的向量属性

我是 Weka 的新手,我正在尝试构建一个分类器来对 EEG 数据进行分类。EEG 属性数据是 5 分钟记录的原始信号以及其他属性。如何以 WEKA arff 文件格式指定我的实例具有 5 分钟原始信号的矢量输入?

例如:

raw属性向量在哪里..

0 投票
1 回答
912 浏览

weka - Weka - 使用多行定义类属性的标称值

在我的 ARFF 文件中,而不是:

我想写一些类似的东西:

原因:myclass 最终将包含近 1000 个值,使用第二种格式更容易阅读和编辑 arff 文件。

我尝试使用上述格式,但收到一条错误消息,提示“无法将结构确定为 arff。

0 投票
1 回答
769 浏览

weka - 如何在weka中声明“类层次属性”

我尝试使用 Weka 创建 .arff 文件并在 CLUS 上运行。但我有层次属性的问题。

@attribute 'class hierarchy' {Dummy,Top/Arts/Animation,Top/Arts}

我通过此代码创建 .arff。

然后当我在 CLUS 中运行“training.arff”时,我收到了以下错误消息:

错误:类值不在树层次结构中:Top/Arts/Animation(查找:Animation,术语:Top/Arts,子术语:Animation})

我认为问题在于我如何将分层属性声明为名义属性,但我没有其他想法如何声明此属性。

每个建议都会有所帮助。提前致谢。