问题标签 [phylogeny]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 plot.phylo 中指定具体分支的宽度
我想使用 3 种不同的线宽在系统发育树上标记不同的分支。如何指定分支 2 的宽度 = 2,第 10 行的宽度 = 4,其余行的宽度 = 1?例如,bird.orders 数据集中有 88 个分支
这,显然没有做任何事情
谢谢!
r - 相关测量的令人费解的平均值
我将此问题提交给 stat.stackexchange
https://stats.stackexchange.com/questions/147909/puzzling-average-of-correlated-measurements
但看起来它更适合该论坛,因为它可能更多的是计算问题而不是统计问题:
我想平均相关测量。给定一组测量值:
其内部相关性由协方差矩阵 C 给出。
Chi2 最小化导致以下平均值:
但是下面的例子让我很困惑:
让我们考虑以下树:
树.mod:
并在 R 中执行:
我很困惑,因为meanX = 2.5,这对应于高相关性的情况,而在那个例子中,协方差矩阵几乎是对角线,所以我期望meanX = 3。
我一定遗漏了什么,欢迎任何意见!谢谢
bioinformatics - Biopython 如何确定系统发育树的根?
还有其他包,尤其是 R 的ape,它们构建了一个无根树,然后允许您通过显式指定一个 outgroup来对其进行根。
相比之下,在 BioPython 中,我可以直接创建一个有根树而不指定根,所以我想知道根是如何确定的,例如从以下代码。
我在构建树之后在这里制作了序列,但尽管如此,这是一个从该过程构建的有根树。
perl - 使用来自另一个文件的信息更改一个文件
我想使用另一个文件中的信息更改 phylip 文件中的名称。phylip 只是一串连续的信息,我想要更改的名称(例如aaaaaaabyd
)嵌入其中。像这样
(没有新行)
里面的名字是一样的aaaaaaaabk
。
另一个文件有信息更改,就像在另一个文件中一样,
我尝试了很多东西,但这是我得到的最接近的。问题是它只为一个人做,并没有打印出 phylip 文件的其余部分。我需要到达 ((Theileria parva:0.23400159127856412500 等。
r - 如何从 R 内存中提取树?
我使用“sim.bd.taxa.age”创建了一个系统发育树。我只是想知道如何以 newick 格式导出树,因为目前它不是 phylo 对象!
bioinformatics - 如何在 MrBayes 中修复分支长度和拓扑
我想知道是否可以同时在 MrBayes 中修复它们?
我看到一些关于修复树拓扑的先前帖子是首先定义树然后使用“固定”功能(假设我们已经定义了species_topology)
第一行固定树形拓扑,第二行定义移动到其他拓扑的概率为零。
我想知道我也可以做类似的事情来修复分支长度吗?就转移到分支长度的建议而言,我认为我们应该使用
但我不确定要输入什么:
提前致谢!我在 MrBayes 的邮件列表中搜索了很多帖子,但他们没有关于同时修复它们的问题。通常,他们只是修复拓扑。
python - Newick 树表示为 scipy.cluster.hierarchy 链接矩阵格式
我有一组基于 DNA 序列比对和聚类的基因,我在 Newick 树表示中拥有这组基因(https://en.wikipedia.org/wiki/Newick_format)。有谁知道如何将此格式转换为 scipy.cluster.hierarchy.linkage 矩阵格式?来自链接矩阵的 scipy 文档:
返回一个 (n-1) x 4 矩阵 Z。在第 i 次迭代中,索引为 Z[i, 0] 和 Z[i, 1] 的簇组合在一起形成簇 n+i。索引小于 n 的集群对应于 n 个原始观测值之一。簇 Z[i, 0] 和 Z[i, 1] 之间的距离由 Z[i, 2] 给出。第四个值 Z[i, 3] 表示新形成的聚类中原始观测值的数量。
至少从 scipy 文档来看,他们对这个链接矩阵的结构的描述相当混乱。他们所说的“迭代”是什么意思?此外,这种表示如何跟踪哪些原始观测值在哪个集群中?
我想弄清楚如何进行这种转换,因为我项目中其他聚类分析的结果已经使用 scipy 表示完成,并且我一直将其用于绘图目的。
r - R- 如何在 haploNet haplotyp Networks {pegas} {ape} {adegenet} 中绘制正确的饼图
当使用 haploNet 包在单倍型网络上绘制一些图时,我使用了 Internet 上可用的脚本来执行此操作。不过我觉得有问题。该脚本以木鼠示例的形式提供。我使用的代码是:
但是,在绘制 ind.hap 时,您会注意到某些行不在正确的位置。你可以在这里看到这个:
您可以看到第 IX 行不在正确的位置。这不会有太大问题,但程序需要第 9 行来绘制 IX 的饼图,即 VIII 的数据。结果是这样的:(我无法插入图像,因为我的声誉低于 10...,无论如何您都可以通过执行整个文件来获得图像)
您可以看到,对于 V 直到 IX,它并不是应有的状态(这些是交换的行)。例如:IX 中只有 1 个单倍型,但有 2 个单倍型的饼图(两者都占图表的 50%),它是使用 VIII 数据生成的。由于行是按字母顺序而不是升序排序的,但这是包固有的,我不知道该怎么做。我远不是 R 的大师,所以尽量不要太抽象,而是提供代码。
如果有人非常了解这个包,请解释为什么在真实图表后面有这些奇怪的额外线条(上面有数字),因为它们在木鼠示例中不可见(可能是因为出了什么问题也?)
提前感谢