我有具有数百个节点和长标签的 hclust 分层集群对象。例如,一个家族中多个基因的同义词。见下文。
我想将hclust切割成更小的子树,然后用灵活的样式将它们可视化。在http://gastonsanchez.com/blog/how-to/2012/10/03/Dendrograms.html之后,我看到了如何切割树状图和漂亮的猿系统发育树。
我只是看不到任何将切割的树状图转换为 phylo 对象的方法。
> as.phylo(as.dendrogram(hc))
Error in UseMethod("as.phylo") :
no applicable method for 'as.phylo' applied to an object of class "dendrogram"
我对任何可以呈现圆形或垂直方向的子树的方法持开放态度。
事实上,我的目标是直观地检测基因同义词中的模式,这样我就可以为它们编写类似胡子模板的东西,所以我什至愿意接受不涉及树状图的解决方案。 有一些关于纯文本的多个序列比对的 SO 帖子,但它们让我有点过头了。
> receptor.synonyms
synonym
1 alpha1B-adrenergic receptor
2 B1AR
3 adrenergic receptor, alpha 2a
4 beta 3-AR
5 alpha-2AAR
6 alpha2-C4
7 Adrb-1
8 Badm
9 beta 1-AR
10 Adrenergic, alpha2C-, receptor class I
11 alpha-1D adrenoceptor
12 beta 2-AR
13 adrenergic receptor
14 alpha-2A-adrenergic receptor
15 Adrenergic, alpha2B-, receptor class III
16 adrenergic, alpha 1B, receptor
17 α<sub>2</sub>-C2
18 adrenergic, alpha-1A-, receptor
19 ADRARL1
20 alpha-1B adrenoceptor
--- snip ---