问题标签 [phylogeny]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 R 中,如何根据系统发育树的尖端和边缘对数据向量进行排序?
我想根据为该树的每个分支估计的一些值绘制具有颜色的系统发育树。根据plot.phylo
phytools 的各种功能,有可能:plot.phylo(tree,edge.color=col)
但向量 col 必须遵循tree$edge
.
这是问题所在:我的数据包括边缘和提示,是否可以在一致的调色板中绘制两者?
简短的例子:
在此先感谢,泽维尔
python - 通过序列输出解析 - Python
我有这些来自对细菌群落进行测序的数据。我知道一些基本的 Python,并且正在完成 codecademy 教程。出于实用目的,请将 OTU 视为“物种”的另一个词
以下是原始数据的示例:
数据包括三件事:物种的参考编号、该物种在样本中的次数以及所述物种的分类。
我正在尝试做的是将所有为分类家族找到序列的时间加起来(f_x
在数据中指定)。
这是所需输出的示例:
这不是为了上课。几个月前我开始学习python,所以我至少能够查找任何建议。我知道它是如何通过缓慢的方式进行的(在 Excel 中复制和粘贴),所以这是供将来参考。
python - 使用 Python 从 Newick 格式中提取分支长度
我在 python 中有一个列表,其中包含一个项目,它是以 Newick 格式编写的树,如下所示:
在树格式中,如下所示:
我正在尝试编写一些代码来查看列表项并返回 ID (BMNHxxxxxx),这些 ID (BMNHxxxxxx) 由 0 的分支长度(例如 <0.001)连接(以红色突出显示)。我考虑过使用正则表达式,例如:
取自另一个 StackOverflow 答案,其中项目 A 将是“:”,因为分支长度始终出现在 a : 之后,而项目 B 将是“,”或“)”或“;” 因为这些有三个字符来分隔它,但我在正则表达式方面没有足够的经验来做到这一点。
在这种情况下,通过使用 0 的分支长度,我希望代码输出 ['BMNH703458a', 'BMNH703458b']。如果我可以将其更改为还包括由用户定义值的分支长度(例如 0.01)连接的 ID,这将非常有用。
如果有人有任何意见,或者可以指出一个有用的答案,我将不胜感激。
r - 使用猿库运行 Rscript 与源代码的区别
我在一个文件中有以下脚本(称之为“temp.R”):
当我运行时,Rscript temp.R
我得到了一些结果:
但是,当我运行 R 然后执行以下操作时:
我收到以下错误:
有谁知道为什么Rscript
和之间存在差异source
,一个有效而另一个失败?如果有帮助,这是version
在 R 中运行的输出:
更新:当我Rscript temp.R
多次运行时,有时会收到与运行时类似的错误消息source
:
r - 如何在猿包中的系统发育树中包含引导值
我正在使用 R 包ape
来分析存储在 DNAbin 对象中的一些序列:
我想找到引导值,所以我使用 boot.phylo:
但我收到一条错误消息:
知道这意味着什么,以及如何解决吗?我尝试用谷歌搜索错误消息,但找不到任何东西。
r - igraph 从系统发育树中丢失内部节点结构(as.igraph() 树转换)
我已经将系统发育树转换为 R 中的 igraph 图对象。转换非常简单。(我什至自己写过)
问题是 igraph 丢失了内部节点并将所有具有相同值的节点放入超级节点中。转换为网络图对象不会这样做。
这要么是一个非常明显的问题,要么不是,但是我如何保留一个 igraph 无向图,使其尽可能接近原始的无根系统发育树?
这是我的树:
仅供参考,使用 as.igraph() 将此树转换为 igraph 将需要以下 hack:
r - glm.nb 具有随机效应作为矩阵
我正在分析R
. 在考虑系统发育效应时,我想测试表达的差异。我可以使用负二项式分布和归一化因子作为偏移量运行 GLM:
但是,我不知道如何在这个模型中包含系统发育效应。我可以从我的系统发育中获得方差-协方差或相关矩阵:
我发现 lmekin 允许指定随机效应的方差-协方差结构:
但我不能指定负二项分布,也不清楚它是否理解偏移量。同样的问题是针对MCMCglmm
.
请帮我放入一个 GLMM:
- 方差-协方差矩阵
- 归一化因子作为偏移量
- 负二项分布
r - 用 R 在系统发育边缘绘制
我想用 R 在系统发育边缘的任何地方画一个符号(十字)。
让我们拿那棵树:
树.mod
并在 hg19 尖端用符号绘制它:
提示很容易:'x' 值是完整的分支长度,'y' 是 1,2,3...
但我不知道如何对内部节点执行此操作,例如 loxAfr3-triMan1。我有'x'但找不到'y'...
欢迎任何输入!
r - 如何在 haploNet Haplotype Networks {pegas} 中绘制饼图
我正在尝试使用 {pegas} 的 haploNet 函数来绘制单倍型网络,但我无法将来自不同群体的相同单倍型放在同一个饼图中。我可以使用以下脚本构建单倍型网络:
我想在 dnabin 数据中设置每个分类群的原始种群的标签,所以我可以在结果网络中拥有不同颜色的饼图(来自不同种群的单倍型)。我还想删除生成的单倍型网络中的重叠圆圈。
谢谢你的帮助!
一个例子:
该脚本用于使用 {pegas} 构建单倍型网络。较大的圆圈代表某种类型的更多单倍型。我想知道如何在 dnabin 矩阵中设置单倍型的起源,以便它们在网络中以不同的颜色出现。