问题标签 [xmeans]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2427 浏览

cluster-analysis - 在 Weka 中以编程方式获取 Xmeans 聚类器输出

在 Weka 中使用 Kmeans 时,可以在模型的结果输出上调用 getAssignments() 来获取每个给定实例的集群分配。这是一个(截断的)Jython 示例:

每个簇号的索引对应于实例。因此,实例 0 在集群 14 中,实例 1 在集群 16 中,依此类推。

我的问题是:Xmeans 有类似的东西吗?我在这里浏览了整个 API并没有看到类似的东西。

0 投票
0 回答
438 浏览

machine-learning - 通过包管理器安装后无法在 Weka 3-7-5 中使用 XMeans

我正在尝试使用让我选择初始种子的聚类算法,因此我决定尝试通过 weka GUI 使用 Weka 的 Xmeans。但是,当我使用 weka 的包管理器安装 Xmeans 时,它在 GUI 中仍然是灰色的,即使加载了 weka 提供的 test.arff 文件之一,我也无法开始集群。谁能指出我正确的方向或建议另一个程序或java库来完成这样的任务?

0 投票
1 回答
3871 浏览

cluster-analysis - 如何使用 Weka 集群 XMeans 将集群分配保存在输出文件中?

语境

我想使用Weka聚类算法XMeans。但是我无法弄清楚如何从GUI of Weka.

目前,我只能看到集群 ID 列表以及分配给每个集群的条目百分比。

问题

有什么方法可以保存每个条目的集群分配,例如CSV格式?

0 投票
1 回答
1053 浏览

cluster-analysis - 为什么 Weka XMeans 系统地低估了集群的数量?

我在使用 Weka 的 XMeans 集群时遇到了一些问题。我已经和其他几个人谈过,我们都同意下面的屏幕截图中有六个集群,或者如果你真的眯着眼睛,至少至少有两个。无论哪种方式,xMeans 似乎都不同意。

六个集群,一个中心点

XMeans 似乎系统地低估了集群的数量,基于我设置的最小集群计数。将最大集群数保持在 100,以下是我得到的结果:

最令人震惊的是,-L 1(和-H 100)只有一个集群被发现。只有将最小集群数设为五个,我才能真正看到六个集群。将改进结构参数提高到 100,000 似乎没有任何效果。(我也玩过其他选项,没有发现任何区别。)以下是生成上述屏幕截图的选项,它找到了一个中心:

显然我在这里遗漏了一些东西。如何使 XMeans 的行为符合预期?

0 投票
1 回答
173 浏览

cluster-analysis - Weka Xmeans:中心初始化过程

在计算数据集的 XMeans 聚类解决方案时,有必要(在算法描述中)正确地播种中心。

在 WEKA Xmeans 中,有一个选项可以指定初始中心。此外,在其他 Xmeans 库中,用户通常必须提供一组初始中心。

但是,如果没有提供,则没有迹象表明 WEKA xmeans 库是否或做什么来创建初始中心。



如果没有提供初始中心,WEKA 如何生成初始中心?或者,是否需要自己生成初始中心才能​​正确运行 Xmeans 算法?

0 投票
1 回答
990 浏览

r - 在 R 中,如何从 XMeans 输出中检索信息

我有一个数据框,df包含一堆点的x和坐标。y这是一段摘录:

我正在尝试找出最合适的集群数量。最终的目标是用数以万计的这些数据帧来做到这一点,所以选择的方法必须是快速的并且不能是可视化的。基于这些要求,RWeka 包似乎是要走的路。

我设法成功加载了 RWeka 包(我必须先在我的计算机上安装 Java SE Runtime)以及 RWeka 的包 XMeans,然后运行它:

这正是我想要的结果:

我可以通过运行将数据框中的每个点分配给集群x_means$class_ids

但是,我想有一种方法来检索集群中心的坐标。我可以在输出中看到它们并手动将它们写下来,但如果我要运行数万个这样的,我需要能够有一段代码将它们保存到一个变量中。我似乎无法x_means使用方括号进行子集化,所以我不知道还能做什么。

非常感谢您的帮助!

0 投票
1 回答
492 浏览

python - 当矩阵具有三个以上维度时,pyclustering 可视化 xmeans

我正在尝试使用 pyclustering 库中的 xmeans 对一些数据进行聚类和可视化。我直接从文档中的示例中复制了代码,

唯一的区别是我分配sample了矩阵 X 的值,而不是加载样本数据集。

当我尝试可视化聚类结果时,出现此错误:

我的 X 矩阵是这样生成的:

有没有办法可视化集群并一次只绘制两个/三个特征?

我在文档中找不到任何内容。

我试过这个:

为了只可视化前两个特征并得到这个错误

编辑:

我按照 annoviko 的答案中的建议更新了代码,但现在出现以下错误:

它由 Visualizer.show() 引发,即使我从函数调用中删除 pair_filter 也会发生。

0 投票
0 回答
12 浏览

python-3.x - 对于 float64 不支持的操作数类型,我收到 TypeError

我正在实现以下代码:XMeans在以下行出现错误:

initial_centers = kmeans_plusplus_initializer(sample, amount_initial_centers).initialize()

错误是:

我还尝试了其他类型——uint8、int64、int32——但我得到了同样的错误。