问题标签 [xmeans]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cluster-analysis - 在 Weka 中以编程方式获取 Xmeans 聚类器输出
在 Weka 中使用 Kmeans 时,可以在模型的结果输出上调用 getAssignments() 来获取每个给定实例的集群分配。这是一个(截断的)Jython 示例:
每个簇号的索引对应于实例。因此,实例 0 在集群 14 中,实例 1 在集群 16 中,依此类推。
我的问题是:Xmeans 有类似的东西吗?我在这里浏览了整个 API并没有看到类似的东西。
machine-learning - 通过包管理器安装后无法在 Weka 3-7-5 中使用 XMeans
我正在尝试使用让我选择初始种子的聚类算法,因此我决定尝试通过 weka GUI 使用 Weka 的 Xmeans。但是,当我使用 weka 的包管理器安装 Xmeans 时,它在 GUI 中仍然是灰色的,即使加载了 weka 提供的 test.arff 文件之一,我也无法开始集群。谁能指出我正确的方向或建议另一个程序或java库来完成这样的任务?
cluster-analysis - 如何使用 Weka 集群 XMeans 将集群分配保存在输出文件中?
语境
我想使用Weka
聚类算法XMeans
。但是我无法弄清楚如何从GUI of Weka
.
目前,我只能看到集群 ID 列表以及分配给每个集群的条目百分比。
问题
有什么方法可以保存每个条目的集群分配,例如CSV
格式?
cluster-analysis - 为什么 Weka XMeans 系统地低估了集群的数量?
我在使用 Weka 的 XMeans 集群时遇到了一些问题。我已经和其他几个人谈过,我们都同意下面的屏幕截图中有六个集群,或者如果你真的眯着眼睛,至少至少有两个。无论哪种方式,xMeans 似乎都不同意。
XMeans 似乎系统地低估了集群的数量,基于我设置的最小集群计数。将最大集群数保持在 100,以下是我得到的结果:
最令人震惊的是,-L 1
(和-H 100
)只有一个集群被发现。只有将最小集群数设为五个,我才能真正看到六个集群。将改进结构参数提高到 100,000 似乎没有任何效果。(我也玩过其他选项,没有发现任何区别。)以下是生成上述屏幕截图的选项,它找到了一个中心:
显然我在这里遗漏了一些东西。如何使 XMeans 的行为符合预期?
cluster-analysis - Weka Xmeans:中心初始化过程
在计算数据集的 XMeans 聚类解决方案时,有必要(在算法描述中)正确地播种中心。
在 WEKA Xmeans 中,有一个选项可以指定初始中心。此外,在其他 Xmeans 库中,用户通常必须提供一组初始中心。
但是,如果没有提供,则没有迹象表明 WEKA xmeans 库是否或做什么来创建初始中心。
如果没有提供初始中心,WEKA 如何生成初始中心?或者,是否需要自己生成初始中心才能正确运行 Xmeans 算法?
r - 在 R 中,如何从 XMeans 输出中检索信息
我有一个数据框,df
包含一堆点的x
和坐标。y
这是一段摘录:
我正在尝试找出最合适的集群数量。最终的目标是用数以万计的这些数据帧来做到这一点,所以选择的方法必须是快速的并且不能是可视化的。基于这些要求,RWeka 包似乎是要走的路。
我设法成功加载了 RWeka 包(我必须先在我的计算机上安装 Java SE Runtime)以及 RWeka 的包 XMeans,然后运行它:
这正是我想要的结果:
我可以通过运行将数据框中的每个点分配给集群x_means$class_ids
。
但是,我想有一种方法来检索集群中心的坐标。我可以在输出中看到它们并手动将它们写下来,但如果我要运行数万个这样的,我需要能够有一段代码将它们保存到一个变量中。我似乎无法x_means
使用方括号进行子集化,所以我不知道还能做什么。
非常感谢您的帮助!
python - 当矩阵具有三个以上维度时,pyclustering 可视化 xmeans
我正在尝试使用 pyclustering 库中的 xmeans 对一些数据进行聚类和可视化。我直接从文档中的示例中复制了代码,
唯一的区别是我分配sample
了矩阵 X 的值,而不是加载样本数据集。
当我尝试可视化聚类结果时,出现此错误:
我的 X 矩阵是这样生成的:
有没有办法可视化集群并一次只绘制两个/三个特征?
我在文档中找不到任何内容。
我试过这个:
为了只可视化前两个特征并得到这个错误
编辑:
我按照 annoviko 的答案中的建议更新了代码,但现在出现以下错误:
它由 Visualizer.show() 引发,即使我从函数调用中删除 pair_filter 也会发生。
python-3.x - 对于 float64 不支持的操作数类型,我收到 TypeError
我正在实现以下代码:XMeans在以下行出现错误:
initial_centers = kmeans_plusplus_initializer(sample, amount_initial_centers).initialize()
错误是:
我还尝试了其他类型——uint8、int64、int32——但我得到了同样的错误。