问题标签 [arff]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - weka可视化选项卡中的jitter是什么意思
在weka我加载了一个 arff 文件。我可以使用可视化选项卡查看属性之间的关系。
但是我无法理解抖动滑块的含义。它的目的是什么?
python - 用python写一个快速解析器
我已经为我们在一次讲座中使用的某种文件格式( ARFF )编写了一个动手递归纯 python 解析器。现在运行我的练习提交非常慢。到目前为止,大部分时间都花在了我的解析器上。它消耗大量CPU时间,HD不是瓶颈。
我想知道在 python 中编写解析器有哪些高效的方法?我宁愿不要用 C 重写它。我尝试使用 jython,但这大大降低了性能!我解析的文件部分很大(> 150 MB),行很长。
我当前的解析器只需要一个字符的前瞻。我会在这里发布源代码,但我不知道这是否是个好主意。毕竟提交截止日期还没有结束。但是,本练习的重点不是解析器。您可以选择您想使用的任何语言,并且已经有一个 Java 解析器。
注意:我有一个 x86_64 系统,所以 psyco(它似乎也是 PyPy)不是选项。
更新:我现在将我的解析器/写入器上传到bitbucket。
java - 重用 Weka 代码解析 ARFF 文件
有人做过吗?有没有关于如何使用这个解析器模块的文档?我已经查看了代码,但我不清楚如何在数据被解析后实际使用它。
文件src\main\java\weka\core\converters\ArffLoader.java(我认为这是 Arff 解析发生的地方)具有以下说明:
- 批量使用的典型代码:
- BufferedReader reader = new BufferedReader(new FileReader("/some/where/file.arff"));
- ArffReader arff = new ArffReader(reader);
- 实例数据 = arff.getData();
- data.setClassIndex(data.numAttributes() - 1);
但是我还能用“数据”做什么?如何访问每一行以及每一行中的值?
(顺便说一句,我是 Java 新手。如果我运行这段代码,是否可以对数据进行某种内省以查看它提供了什么?这就是我在 Python 中会做的事情。)
(如果存在的话,我也愿意在我的项目中使用更简单的开源 Arff 解析器的建议。)
java - 使用 Weka Java 代码 - 如何将 CSV(无标题行)转换为 ARFF 格式?
我正在使用 Weka Java 库读取 CSV 文件并将其转换为 ARFF 文件。
问题是CSV 文件没有标题行,只有数据。导入 CSV 文件后如何分配属性名称?(所有列都是字符串数据类型)
这是我到目前为止的代码:
我试图通过 Weka 源代码来解决这个问题,但我无法确定它的正面或反面:-(
xml - WEKA 文件格式
我可以给 WEKA 提供xml
文件吗?还是我应该使用arff
格式?
谢谢
python - 从 python 输出创建一个 ARFF 文件
我有一个 python 脚本,它从文本文件中提取单词并计算它们在文件中出现的次数。
我想将它们添加到“.ARFF”文件中以用于 weka 分类。以上是我的 python 脚本的示例输出。如何将它们插入 ARFF 文件,使每个文本文件分开。每个文件都由 {"with their words in here!!"} 来区分
cluster-analysis - 在命令行使用 Weka 生成集群分配 arff 文件
在 weka 的资源管理器上,您可以对数据执行聚类,然后使用可视化来保存一个新的 arff 文件,并将聚类分配作为属性。
有没有办法通过在命令行上调用可执行文件来自动执行此操作?
python - 从词频创建 ARFF
我有一些代码可以为我提供一个单词列表以及它们在文本中出现的频率,我正在寻找它,以便代码自动将前 10 个单词转换为 ARFF
@RELATION 词频
@ATTRIBUTE 字串 @ATTRIBUTE 频率数字
和前 10 名的数据及其频率。
我正在努力解决如何使用我当前的代码来做到这一点
对此的任何帮助表示赞赏,这样做的方法真的让我绞尽脑汁!
weka - 在 weka 中对来自 ARFF 的数据进行分类
我有一个已加载到 weka 资源管理器中的 ARFF。我对 weka 很陌生,但据我了解,我拥有的 arff 应该可以工作,但是似乎没有一个分类器可以使用它?
我错过了添加到 arff 文件的内容吗?任何帮助表示赞赏。谢谢。
java - Java SimpleDateFormat 将问题解析为 WEKA
我发誓我使用了正确的日期格式,但在加载到 WEKA 时我不断收到解析错误。
这是一个示例数据集:
WEKA 错误:
已经使用 API 文档进行了仔细检查 - 遗漏了什么?
http://download.oracle.com/javase/1.4.2/docs/api/java/text/SimpleDateFormat.html
编辑 - - - - - -
格式化日期以用空格分隔标记。还是没在WEKA打球……