问题标签 [hcluster]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3099 浏览

python - Python中的层次聚类问题

我正在通过相关距离度量(即 1 - Pearson 相关)对二维矩阵进行层次聚类。我的代码如下(数据在一个名为“data”的变量中):

我得到的错误是:

是什么导致了这个错误?我使用的矩阵“数据”很简单:

我看不出 pdist 在采用 1 - pearson 相关时如何产生负数。对此有什么想法吗?

谢谢你。

0 投票
1 回答
689 浏览

python - 无法在 xp 上的 python 2.6 下从 pypi 安装 hcluster

我正在使用 hcluster 提供的 setup.py 文件,并添加了以下行:

然后使用 setup.py 如下:

"c:\program files\python26\python.exe" "c:\Program Files\Python26\Lib\site-packages\hcluster-0.2.0\setup.py" 安装

我收到以下错误消息:

不知道它是否试图读取或写入 hcluster。

任何帮助表示赞赏

0 投票
1 回答
1153 浏览

python - 如何在 python hcluster 中使用稀疏矩阵?

我正在尝试在 python 中使用 hcluster 库。我没有足够的 Python 知识在 hcluster 中使用稀疏矩阵。请任何人帮助我。所以,我在做什么:

data.dmp 包含的矩阵如下:

并且只包含矩阵的右上部分。我不知道如何正确拼写英文:) 所以,所有数字都高于主对角线所以 data.dmp 包含: 1 0 1, 0 1 , 0

由于我未知的原因,hcluster 使用反转值,例如如果 A!=C 我使用 0,如果 A == D 使用 1

连锁Y

所以,矩阵 Z 是我需要的(如果我正确使用了 hcluster?)

但我有下一个问题:

  1. 我想对大量输入数据使用稀疏矩阵,因为像现在这样生成输入数据很耗时,我需要从另一种语言将数据导入 python,这就是我需要读取文本文件的原因。请好心,python大师的建议如何制作?

  2. 对于使用 python hcluster 的人,我需要处理大量数据,数百行,可以在 hcluster 中完成吗?这个算法真的能产生正确的HAC吗?

感谢您的阅读,感谢您的帮助!

0 投票
1 回答
2087 浏览

python - python hcluster,距离矩阵和压缩距离矩阵

我正在使用模块 hcluster 从距离矩阵计算树状图。我的距离矩阵是这样生成的数组数组:

然后我使用命令distVec = hcluster.squareform(distMatrix)将矩阵转换为压缩向量并计算链接矩阵vecLink = hcluster.linkage(distVec)

所有这一切都很好,但如果我使用距离矩阵而不是压缩向量计算链接矩阵,matLink = hcluster.linkage(distMatrix)我会得到一个不同的链接矩阵(节点之间的距离要大得多,拓扑结构略有不同)

现在我不确定这是否是因为 hcluster 仅适用于压缩向量,或者我是否在途中犯了错误。

谢谢你的帮助!

0 投票
2 回答
2487 浏览

python - 将 hcluster 生成的 ndarray 转换为 Newick 字符串,以便与 ete2 包一起使用

我有一个通过运行创建的向量列表:

其中 document_list 是我正在分析的 Web 文档的集合。然后我执行层次聚类:

这会生成一个 ndarray,例如:

是否可以将此 ndarray 转换为可以传递给 ete2 Tree() 构造函数的 newick 字符串,以便我可以使用 ete2 提供的工具绘制和操作 newick 树?

尝试这样做是否有意义,如果没有,是否有另一种方法可以使用相同的数据和 ete2 生成树/树状图(我意识到还有其他可以绘制树状图的包,例如 dendropy 和 hcluster 本身但是更愿意使用 ete2 一样)?

谢谢!

0 投票
1 回答
3477 浏览

python - 如何构建和安装 hcluster?

我从http://pypi.python.org/pypi/hcluster下载 hcluster ,然后解压缩到一个文件夹,然后键入"python setup.py install". 似乎还可以,因为它显示:

但我尝试“导入 hcluster”,它显示:

我是一个为 Python 模块构建、编译、安装等的新手,有人可以详细说明如何解决这个问题吗?谢谢

(我使用的是 Windows XP 和 Python 2.6.1)

0 投票
0 回答
574 浏览

python - 即使在我的计算机中也找不到 vcvarsall.bat

我正在尝试使用 easy_install 安装 hcluster 库链接,但出现错误“错误:安装脚本退出并出现错误:无法找到 vcvarsall.bat”

问题是,如果我在我的电脑中搜索,文件在这里“C:\Program Files (x86)\Microsoft Visual Studio 11.0\VC”

我用谷歌搜索,但我发现的每个网站都发送他们根本没有文件。

0 投票
1 回答
370 浏览

python - 在 python 中使用 hcluster 进行层次聚类时出错

我正在尝试运行以下代码,我得到一个 AttributeError: 'module' object has no attribute 'hcluster',在最后一行提出。

我在 Mountain Lion 中运行,我使用 pip 和 homebrew,并且 hcluster 在 PYTHONPATH=/usr/local/lib/python2.7/site-packages 中。

知道可能出了什么问题吗?谢谢。

0 投票
1 回答
3683 浏览

python - 通过 scipy 给定相似矩阵的树状图

我已经用 Python 计算了一个 Jaccard 相似度矩阵。我想将最高相似度聚类到最低相似度,但是,无论我使用什么链接函数,它都会产生相同的树状图!我有一种感觉,该函数假设我的矩阵是原始数据,但我已经计算了第一个相似度矩阵。有没有办法将这个相似度矩阵传递给树状图,以便正确绘制?或者我将不得不输出矩阵并简单地使用 R 来完成。通过原始原始数据是不可能的,因为我正在计算单词的相似性。谢谢您的帮助!

这是一些代码:

如果您运行此代码,您将看到一个完全向后的树状图。无论我使用什么链接类型,它都会产生相同的树状图。这凭直觉不可能是正确的!

0 投票
1 回答
175 浏览

r - 如何减少叶子长度以在 R 树状图中拟合标签?

我用hcluster. 原始树状图

出于格式化目的,我使用了as.dendogram. 当我这样做时,我的标签被剪掉了。 垂直树状图

水平方向更是如此。我需要的那个。 水平树状图

这个问题并不存在于边缘,因为(对于水平的)我使用par(oma = c(0, 0, 0, 8)了非标签效果。它只会减少我的利润,但不会为标签名称提供更多空间。如何确保绘图显示整个模型名称?