问题标签 [weka]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 从词频创建 ARFF
我有一些代码可以为我提供一个单词列表以及它们在文本中出现的频率,我正在寻找它,以便代码自动将前 10 个单词转换为 ARFF
@RELATION 词频
@ATTRIBUTE 字串 @ATTRIBUTE 频率数字
和前 10 名的数据及其频率。
我正在努力解决如何使用我当前的代码来做到这一点
对此的任何帮助表示赞赏,这样做的方法真的让我绞尽脑汁!
weka - 在 weka 中对来自 ARFF 的数据进行分类
我有一个已加载到 weka 资源管理器中的 ARFF。我对 weka 很陌生,但据我了解,我拥有的 arff 应该可以工作,但是似乎没有一个分类器可以使用它?
我错过了添加到 arff 文件的内容吗?任何帮助表示赞赏。谢谢。
weka - WEKA:如何从分类实例中获得分数?
我正在使用 FilteredClassifier.classifyInstance() 对 weka 中的实例进行分类。
我有 2 个类(真假),我有很多正面,所以我实际上需要知道每个实例的分数才能获得最好的正面。
你知道我如何从我的 weka 分类器中获得分数吗?
谢谢
更新:我也尝试过使用distributionForInstance,但是对于每个实例,我总是得到一个带有[1.0,0.0]的数组。
我实际上需要比较几个实例,看看哪个最可靠,哪个有更多变化才能正确分类。
file - 如何为 weka 工具获取合适的输入文件格式?
我正在使用 weka 工具尝试从数据集中生成一组分类规则。数据集当前是一个 .txt 文件,格式如下:
(每个单词用制表符分隔)
如何将其转换为适合 weka 的输入文件?我尝试将其转换为 csv 然后转换为 arff 格式,但它不起作用并不断给我 2 个错误之一header stream is invalid
或attribute names are not unique
.
attributes - 在 WEKA 中,我可以在离散化后汇总一个范围吗?
我有一个数字类型属性,我将它离散为 6 个 bin。
但是,离散化后,范围看起来像(3.663336-4.325577]
如果我希望它是综述或看起来像(3.7-4.3]
我应该怎么做?
谢谢。
r - R:每次运行时聚类结果都不同
在'amap'包中运行了几次,但即使参数和种子值始终相同,每次运行Kmeans或其他聚类方法时,聚类结果都不同。
我在不同的包中尝试了另一个 kmeans 函数,但仍然相同......
事实上,我想同时使用 Weka 和 R,所以我也尝试SimpleKMeans
了 RWeka 包,这总是给出相同的值。但是,问题是我不知道如何在 RWeka 中存储来自 SimpleKmeans 的集群数据以及集群编号,所以我被卡住了......
无论如何,我怎样才能保持聚类结果始终相同?或如何将聚类结果存储SimpleKmeans
到 R 中?
java - Java SimpleDateFormat 将问题解析为 WEKA
我发誓我使用了正确的日期格式,但在加载到 WEKA 时我不断收到解析错误。
这是一个示例数据集:
WEKA 错误:
已经使用 API 文档进行了仔细检查 - 遗漏了什么?
http://download.oracle.com/javase/1.4.2/docs/api/java/text/SimpleDateFormat.html
编辑 - - - - - -
格式化日期以用空格分隔标记。还是没在WEKA打球……
java - 为什么 Weka GUI 输出与 Java 代码不同?
为什么在 Weka GUI 中运行过滤器 StringToWordVector 的结果与等效的 java 代码不同?我使用的属性与我在 gui 中使用的属性相同,但 java 中的分词器似乎没有做正确的工作!一位博士生告诉我,这很常见,他没有进一步的回答。
请帮忙。我的项目停滞不前。
这是我的代码:
cluster-analysis - WEKA K-Means 聚类
任何人都可以解释 WEKA 中 K-Means 聚类的输出实际上意味着什么。
例如
列中的数字实际上是什么意思,它表示表格上方的聚类质心,但是如何确定两个聚类的质心是什么?
如果有人能解释这些数字的含义,我将不胜感激。
如果有人对如何完成对发现的集群的轮廓评估有任何想法,那也很棒。
谢谢
machine-learning - WEKA:属性量表问题
我有一个训练数据集和多个测试集(我在聚类框架中对实例进行分类,因此测试集的实例是动态计算的)。
实例属性有不同的尺度(第一个从 0 到 1,第二个从 0 到 100)。
我的分类器(逻辑回归和 SMO)如何处理他们没有同时拥有整个测试集的事实?
换句话说,如果他们不知道测试集中的最大值是多少,他们如何处理不同的尺度属性?
谢谢