问题标签 [hcluster]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python中的层次聚类问题
我正在通过相关距离度量(即 1 - Pearson 相关)对二维矩阵进行层次聚类。我的代码如下(数据在一个名为“data”的变量中):
我得到的错误是:
是什么导致了这个错误?我使用的矩阵“数据”很简单:
我看不出 pdist 在采用 1 - pearson 相关时如何产生负数。对此有什么想法吗?
谢谢你。
python - 无法在 xp 上的 python 2.6 下从 pypi 安装 hcluster
我正在使用 hcluster 提供的 setup.py 文件,并添加了以下行:
然后使用 setup.py 如下:
"c:\program files\python26\python.exe" "c:\Program Files\Python26\Lib\site-packages\hcluster-0.2.0\setup.py" 安装
我收到以下错误消息:
不知道它是否试图读取或写入 hcluster。
任何帮助表示赞赏
python - 如何在 python hcluster 中使用稀疏矩阵?
我正在尝试在 python 中使用 hcluster 库。我没有足够的 Python 知识在 hcluster 中使用稀疏矩阵。请任何人帮助我。所以,我在做什么:
data.dmp 包含的矩阵如下:
并且只包含矩阵的右上部分。我不知道如何正确拼写英文:) 所以,所有数字都高于主对角线所以 data.dmp 包含: 1 0 1, 0 1 , 0
由于我未知的原因,hcluster 使用反转值,例如如果 A!=C 我使用 0,如果 A == D 使用 1
连锁Y
所以,矩阵 Z 是我需要的(如果我正确使用了 hcluster?)
但我有下一个问题:
我想对大量输入数据使用稀疏矩阵,因为像现在这样生成输入数据很耗时,我需要从另一种语言将数据导入 python,这就是我需要读取文本文件的原因。请好心,python大师的建议如何制作?
对于使用 python hcluster 的人,我需要处理大量数据,数百行,可以在 hcluster 中完成吗?这个算法真的能产生正确的HAC吗?
感谢您的阅读,感谢您的帮助!
python - python hcluster,距离矩阵和压缩距离矩阵
我正在使用模块 hcluster 从距离矩阵计算树状图。我的距离矩阵是这样生成的数组数组:
然后我使用命令distVec = hcluster.squareform(distMatrix)
将矩阵转换为压缩向量并计算链接矩阵vecLink = hcluster.linkage(distVec)
。
所有这一切都很好,但如果我使用距离矩阵而不是压缩向量计算链接矩阵,matLink = hcluster.linkage(distMatrix)
我会得到一个不同的链接矩阵(节点之间的距离要大得多,拓扑结构略有不同)
现在我不确定这是否是因为 hcluster 仅适用于压缩向量,或者我是否在途中犯了错误。
谢谢你的帮助!
python - 将 hcluster 生成的 ndarray 转换为 Newick 字符串,以便与 ete2 包一起使用
我有一个通过运行创建的向量列表:
其中 document_list 是我正在分析的 Web 文档的集合。然后我执行层次聚类:
这会生成一个 ndarray,例如:
是否可以将此 ndarray 转换为可以传递给 ete2 Tree() 构造函数的 newick 字符串,以便我可以使用 ete2 提供的工具绘制和操作 newick 树?
尝试这样做是否有意义,如果没有,是否有另一种方法可以使用相同的数据和 ete2 生成树/树状图(我意识到还有其他可以绘制树状图的包,例如 dendropy 和 hcluster 本身但是更愿意使用 ete2 一样)?
谢谢!
python - 如何构建和安装 hcluster?
我从http://pypi.python.org/pypi/hcluster下载 hcluster ,然后解压缩到一个文件夹,然后键入"python setup.py install"
. 似乎还可以,因为它显示:
但我尝试“导入 hcluster”,它显示:
我是一个为 Python 模块构建、编译、安装等的新手,有人可以详细说明如何解决这个问题吗?谢谢
(我使用的是 Windows XP 和 Python 2.6.1)
python - 即使在我的计算机中也找不到 vcvarsall.bat
我正在尝试使用 easy_install 安装 hcluster 库链接,但出现错误“错误:安装脚本退出并出现错误:无法找到 vcvarsall.bat”
问题是,如果我在我的电脑中搜索,文件在这里“C:\Program Files (x86)\Microsoft Visual Studio 11.0\VC”
我用谷歌搜索,但我发现的每个网站都发送他们根本没有文件。
python - 在 python 中使用 hcluster 进行层次聚类时出错
我正在尝试运行以下代码,我得到一个 AttributeError: 'module' object has no attribute 'hcluster',在最后一行提出。
我在 Mountain Lion 中运行,我使用 pip 和 homebrew,并且 hcluster 在 PYTHONPATH=/usr/local/lib/python2.7/site-packages 中。
知道可能出了什么问题吗?谢谢。
python - 通过 scipy 给定相似矩阵的树状图
我已经用 Python 计算了一个 Jaccard 相似度矩阵。我想将最高相似度聚类到最低相似度,但是,无论我使用什么链接函数,它都会产生相同的树状图!我有一种感觉,该函数假设我的矩阵是原始数据,但我已经计算了第一个相似度矩阵。有没有办法将这个相似度矩阵传递给树状图,以便正确绘制?或者我将不得不输出矩阵并简单地使用 R 来完成。通过原始原始数据是不可能的,因为我正在计算单词的相似性。谢谢您的帮助!
这是一些代码:
如果您运行此代码,您将看到一个完全向后的树状图。无论我使用什么链接类型,它都会产生相同的树状图。这凭直觉不可能是正确的!