问题标签 [arff]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
weka - Weka中ARFF格式的属性太多
我正在使用维度超过 10,000 的数据集。要使用 Weka 我需要将文本文件转换为 ARFF 格式,但是由于即使使用稀疏 ARFF 格式文件大小太大,属性也太多。是否有与数据类似的方法来避免在 ARFF 文件的标题中写入如此多的属性标识符。
例如:
@attribute A1 NUMERICAL
@attribute A2 NUMERICAL
...
...
@attribute A10000 NUMERICAL
weka - 缺少值的 Weka
作为这个人,我有一个关于 weka 的问题:
大家好:
我对 WEKA 感到很奇怪。
我准备了一个包含很多缺失值的 CSV 文件。此文件中的一个缺失值是基本的,只是在一对逗号之间没有任何值,即,random_value1,,random_value2。这是格式的一个例子。您可以看到有一对逗号,它们之间没有任何东西,甚至没有空格,它应该表示数据的缺失值。
奇怪的是,当我将此 CSV 读入 WEKA 时,WEKA 会将所有缺失值分配给问号,即“?”。这正是 WEKA 的表达方式。
然后当我运行测试分析时,WEKA 开始研究这些“?” 作为某种有用的信息。它只是缺少值,WEKA 可以跳过它吗?
这些问题变得非常浪费。分析结果类似于如果缺失则值缺失,缺失与缺失相关,缺失与缺失相关。
WEKA 可以将缺失值读取为缺失值,而不是某种问号吗?或者我可以告诉 WEKA 对于所有“?”,将它们视为缺失值?
多谢你们
他使用这个解决方案解决了他的问题:
我找到了一种方法来告诉 WEKA 失踪的事情。只需使用 ASCII 编辑器的 fine_and_replace 功能,替换所有的 '?' 至 ?。
>
但我不知道如何下载 ASCII Editor 并使用它,谁能告诉我????
java - Weka打印稀疏arff文件
我正在尝试 arff 文件的稀疏表示,如此处所示。在我的程序中,我可以打印类标签“B”,但由于某种原因它没有打印“A”。
该程序的输出就像 -
但是当我这样做时
我得到正确的输出 -
由于某种原因,它没有采用索引 0。有人可以告诉我为什么会这样吗?
r - 在 R 中读取 arff 文件
我想使用 R 读取来自 UCI 和 Amazon 评论的数据集。
数据集采用 ARFF (.arff) 格式。
我正在使用以下脚本:
我收到以下错误
read.arff("amazon.arff") 中的错误:属性规范无效。
感谢您在高级方面的帮助。
weka - weka 中的 ARFF 输出根据是否增量保存而有所不同
下面是一个程序,它显示了如果来自 weka 的 ARFF 保护程序以增量模式写入,字符串是如何错误输出的。如果将参数传递给程序,则以下程序以增量模式运行,如果未传递参数,则以批处理模式运行。
请注意,在批处理模式下,ARFF 文件包含字符串...正常操作。在增量模式下,ARFF 文件包含整数而不是字符串……奇怪!
关于如何让 ARFF 格式化程序以增量格式输出字符串的任何想法?
weka - 如何从 .txt 创建 .arff 文件?
有什么简单的方法可以做到这一点吗?我不是Java,我是Python新手,所以我需要另一种方式。提前致谢!
weka - Weka 中名义属性的取值范围
我有一个名义属性可用于使用 Weka 进行数值预测。但是这个名义属性恰好有957 个可能的值(1-957)。有没有办法在ARFF 输入文件中指定它。一种明显的方法是编写一个脚本来生成1-957逗号分隔的条目。
但我只是想知道 WEKA 是否提供了任何解决方法?
machine-learning - WEKA - arff 格式的向量属性
我是 Weka 的新手,我正在尝试构建一个分类器来对 EEG 数据进行分类。EEG 属性数据是 5 分钟记录的原始信号以及其他属性。如何以 WEKA arff 文件格式指定我的实例具有 5 分钟原始信号的矢量输入?
例如:
raw
属性向量在哪里..
weka - Weka - 使用多行定义类属性的标称值
在我的 ARFF 文件中,而不是:
我想写一些类似的东西:
原因:myclass 最终将包含近 1000 个值,使用第二种格式更容易阅读和编辑 arff 文件。
我尝试使用上述格式,但收到一条错误消息,提示“无法将结构确定为 arff。
weka - 如何在weka中声明“类层次属性”
我尝试使用 Weka 创建 .arff 文件并在 CLUS 上运行。但我有层次属性的问题。
@attribute 'class hierarchy' {Dummy,Top/Arts/Animation,Top/Arts}
我通过此代码创建 .arff。
然后当我在 CLUS 中运行“training.arff”时,我收到了以下错误消息:
错误:类值不在树层次结构中:Top/Arts/Animation(查找:Animation,术语:Top/Arts,子术语:Animation})
我认为问题在于我如何将分层属性声明为名义属性,但我没有其他想法如何声明此属性。
每个建议都会有所帮助。提前致谢。