问题标签 [cluster-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
2009 浏览

cluster-analysis - 如何根据主题对短消息 [Tweets] 进行聚类?[基于主题的聚类]

我正在计划一个应用程序,它将根据主题制作短消息/推文集群。主题的数量将受到限制,例如体育 [NBA、NFL、板球、足球]、娱乐 [电影、音乐] 等等......

我可以想到两种方法

  • 要求用户像 Stackoverflow 那样标记问题。用户可以从预定义的标签列表中选择标签。然后在服务器端,我将根据标签对它们进行聚类。优点:- 简单的设计。代码复杂度较低。缺点:- 用户的选择将受到限制。集群不会是动态的。如果发生新事件,预定义的标签将错过它。
  • 获取消息,删除停用词[在字典中预定义],对词干消息应用一些聚类算法以形成一个聚类,并根据其流行度显示该聚类。集群将一直显示,直到它仍然流行[许多消息/分钟]。新消息将被浏览并分配给相应的集群。优点:- 基于事件/事故的流行程度的动态聚类。缺点:- 增加复杂性。需要更多的服务器资源。

我想知道这个问题是否还有其他方法。或者有什么方法可以改进上述方法?

还建议一些好的聚类算法。我认为“K-Nearest Clustering”算法适合这种情况。

0 投票
3 回答
2718 浏览

algorithm - 以距离矩阵为输入的聚类[评估]算法

谁能建议一些可以使用距离矩阵作为输入的聚类算法?或者也可以基于距离矩阵评估聚类“好”的算法?

目前,我正在使用 Kruskal 算法的修改 ( http://en.wikipedia.org/wiki/Kruskal%27s_algorithm ) 将数据拆分为两个集群。它有一个问题。当数据没有不同的簇时,算法仍将创建两个簇,一个簇包含一个元素,另一个包含所有其余元素。在这种情况下,我宁愿有一个包含所有元素的集群,而另一个是空的。

是否有任何算法能够进行这种类型的聚类?

是否有任何算法可以估计聚类的完成情况,甚至更好地估计数据中有多少聚类?

该算法应仅使用距离(相似度)矩阵作为输入。

0 投票
3 回答
6558 浏览

matlab - 在 MATLAB 中使用 clusterdata 时出现内存不足错误

我正在尝试聚类一个矩阵(大小:20057x2)。:

但我收到此错误:

有人能帮我吗。我有 4GB 的内存,但认为问题出在其他地方..

0 投票
1 回答
76 浏览

algorithm - 哪个集群节点应该处于活动状态?

有一些集群,还有一些 unix 网络守护进程。此守护程序在每个集群节点上启动,但只有一个可以处于活动状态。

当活动的守护进程中断(节点中断的程序中断)时,其他节点应该变为活动的。

我可以想到一些可能的算法,但我认为已经对此进行了一些研究,还有一些现成的算法?我对吗?你能指出我的答案吗?

谢谢。

0 投票
2 回答
872 浏览

c# - 确定一组坐标是否在同一区域内

当我说坐标时,我的意思是地球的纬度和经度坐标。我想确定一组坐标是否在同一区域内(我的截止点是 200 英里)。我一直在谷歌搜索“集群算法”,但我不确定哪个最适合我。

谢谢

0 投票
3 回答
934 浏览

algorithm - 哪种聚类方法适用于哪种数据?

我想知道

  1. K-means 最适合对哪种类型的数据进行聚类?
  2. 当k-means失败时?对于哪种类型的数据集,k-means 不能给出准确的答案?
  3. COBWEB 最适合对哪种类型的数据进行聚类?
  4. 当 COBWEB 失败时?对于哪种类型的数据集 COBWEB 没有给出准确的答案?
0 投票
2 回答
29404 浏览

python - 在python中的数据矩阵上绘制层次聚类的结果

如何在 Python 中在值矩阵的顶部绘制树状图,并适当地重新排序以反映聚类?一个例子是下图:

https://publishing-cdn.elifesciences.org/07103/elife-07103-fig6-figsupp1-v2.jpg

我使用 scipy.cluster.dendrogram 来制作我的树状图并对数据矩阵执行层次聚类。然后如何将数据绘制为矩阵,其中行已重新排序以反映在特定阈值处切割树状图引起的聚类,并将树状图绘制在矩阵旁边?我知道如何在 scipy 中绘制树状图,但不知道如何用右侧的比例尺绘制数据的强度矩阵。

对此的任何帮助将不胜感激。

0 投票
2 回答
6070 浏览

python - 在 Python 中计算 scipy/numpy 中二维矩阵的 z 分数

如何计算 Python 中矩阵的 z 分数?

假设我有数组:

我想计算每一行的 z 分数。我想出的解决方案是:

zs 在 scipy.stats.stats 中。有没有更好的内置矢量化方式来做到这一点?

此外,在使用具有欧几里得或苏几里得距离的层次聚类之前,z 分数总是好的吗?任何人都可以讨论相对的优点/缺点吗?

谢谢。

0 投票
2 回答
1315 浏览

python - 如何使用 R-Tree 在谷歌地图上绘制大量地图标记

在搜索 SO 和多篇文章后,我还没有找到解决问题的方法。

我想要实现的是在谷歌地图上加载 20,000 个标记。

R-Tree似乎是一个不错的方法,但它仅在搜索地图可见部分内的点时才有用。当地图被缩小时,它会返回所有的点并且......崩溃浏览器。

拖动地图并在拖动结束时重新运行查询也存在问题。

我想知道如何使用 R-Tree 并能够实现上述所有目标。

0 投票
2 回答
2615 浏览

r - 有没有办法从 hclust 获取“子树”?(右)

我希望从 hclust 对象创建一个“子树”。

例如,假设我有以下对象:

现在我希望从中提取以下子树:

我怎么能访问它?

(我知道 cutree 可以让我获得子树的对象,但不能创建实际的 hclust 对象)

谢谢你的帮助,

塔尔