问题标签 [phylogeny]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
106 浏览

r - R:多重回归错误(在需要的地方缺少真/假)

我的 R sessionInfo() 失败运行:

我正在努力隔离哪些变量在交互时导致特定失败。(更新:没有特定的预测器,它只是超过阈值的预测器数量由物种数量决定)


我有一个错误,它似乎是 R 中“caper”包的内部错误。确切的错误是:

使用下面的 7 个预测变量,dataSet1.txt我发现回归与和完美配合。使用下面的 12 个预测变量,我发现只有“)”有效并且两者都有效并产生上面的错误。这是重现我的错误所需的最少代码:))^2)^3dataSet2.txt)^2)^3

由于占用的空间,我已经编辑了我之前提供的数据。由于现在很明显这个错误是一个普遍问题(见下文),您可以在http://cran.r-project.org/web/packages/caper/vignettes/caper.pdf中找到要检查的数据集

0 投票
1 回答
786 浏览

r - 如何从 Caper R 包中的 pgls() 获取学生化残差

我有一个包含 135 个物种、6 个生活史特征(响应)和 2 个环境变量(预测变量)的数据集。我有兴趣使用 Caper 包进行 pgls 回归分析,以查看环境变量对每个生活史特征的影响。由于其中一个性状是女性体重,我计算了每个性状对女性体重的 pgls 回归,并在针对环境变量的多元回归中使用了随后的残差。为了检查回归诊断在针对体重的单变量特征回归中是否正常,我使用了 plot.pgls()。这些图显示了一些异常值的存在。在 Caper 中使用 pgls 的一些论文中,学生化残差 > 3 的数据点已被排除为异常值。

  1. 有人可以帮我弄清楚如何从 Caper 的 pgls 回归中计算学生化残差吗?
  2. pgls 回归给出系统发育和非系统发育残差。其中哪一个是学生化残差计算的?

谢谢你的时间和帮助,pb

0 投票
1 回答
848 浏览

r - R:减少模型公式后如何更新模型框架

我正在使用 Windows 7 上的 caper 包进行系统发育多元回归,并且在生成简化模型后尝试绘制剩余杠杆图时,我一直收到模型框架/公式不匹配错误。

这是重现错误所需的最少代码:


当我尝试绘制剩余杠杆图以查看模型复杂性的影响时,出现以下错误:

如何更新我的模型框架以再次检查厨师的距离(图形或数字)?

0 投票
0 回答
148 浏览

python-2.7 - 使用 Biopython Phylo 将终端重命名为 None

我一直在使用 Biopython 将一些氨基酸序列与 Clustal-Omega 对齐,然后导入生成的树。

因此,导入的树现在有一些名为 None 的叶子/终端,并且缺少等效数量的命名叶子。

我尝试在树上查看文件(由 clustalo 格式化),并注意到被重命名为 none 的基因在它们之后总是有 -0,例如:

-0 是什么意思,我该如何解决这个问题,以便命名我的所有终端?

作为旁注,当我用 DNA 序列填充我的 fasta 文件而不是对齐并导入该树时,它似乎没有发生。

0 投票
2 回答
325 浏览

clojure - “rerootable”纯功能树数据结构

我最近购买了 Joseph Felsenstein 的《推断系统发育》,这是一本关于推断系统发育树的数学和计算方法的好书,并且一直在尝试实现它所描述的一些算法。

具体来说,我有兴趣在具有持久性数据结构的功能设置中这样做,因为许多方法都涉及遍历可能的树空间,并且通过结构来廉价地记住我们去过的地方的历史会很好共享(这是 aphyr 在这篇博文中对“世界”所做的事情)、轻松缓存先前计算的子树值等。

这样做的问题是,很多方法都涉及“重新生根”树,我无法弄清楚如何以纯粹的功能方式廉价地做到这一点。基本上我需要一些方法来捕捉以下每一个的想法(使用 clojure 表示法,将树表示为向量):

表示相同的数据,仅在根的位置不同;它们各自代表无根树:

我希望能够使用 zipper 导航到其中一棵树,然后调用一个函数reroot,该函数将返回一个新树,该树以这样一种方式压缩,即根位于 current loc

在书中,Felsenstein 描述了一种用于廉价可重根树的数据结构,它看起来像下面匆忙制作的图表

可怕的图表

其中圆圈是结构,箭头是指针。结构环是树上的内部节点,一旦我们引用了一个,我们可以通过一些指针交换将根移到那里。不幸的是,这是一个变异操作,需要相互引用,这两者在纯函数设置中都是不可能的。

我觉得应该有一种方法可以使用拉链做我想做的事,但我已经玩clojure.core/zip了一段时间了,却一无所获。

有谁知道这样的实现,或者对我应该阅读的东西/我应该看的论文/如何做到这一点的想法有建议?

谢谢!

0 投票
1 回答
449 浏览

r - 系统发育祖先重建:指定单向字符状态变化的模型 [ape] [phytools]

假设我有一个系统发育树和我的树的一些字符数据。我知道一个字符是单向的:从 0 到 1 的转变率为正,但从 1 到 0 的转变率为零(例如,0 是二倍体,1 是多倍体)。假设我想对我的树进行祖先重建。我知道我可以使用 Ape 包中的 Ace 或 phytools 包中的 make.simmap 来进行祖先重建,但我不知道如何指定单向字符更改的模型。

例子:

有人知道该怎么做吗?

0 投票
2 回答
2701 浏览

r - 具有分类变量和 R 中的系统发育树的热图

:)

我有一个问题,通过个人搜索没有找到任何答案。我想用分类变量制作一个热图(有点像这个:类似热图的图,但是对于分类变量),我想在左侧添加一个系统发育树(像这个:如何创建一个具有固定外部层次集群的热图)。理想的情况是改编第二个,因为它看起来更漂亮!;)

这是我的数据:

  • 一个 newick 格式的系统发育树,有 3 个物种,比方说:

    /li>
  • 一个数据框:

    /li>

(其中 A、B 和 C 是分类变量,例如在我的情况下存在/不存在/重复基因)。

你知道怎么做吗?

提前谢谢了!


编辑:我希望能够选择热图中每个类别的颜色,而不是经典的渐变。假设 A=绿色,B=黄色,C=红色

0 投票
1 回答
1053 浏览

tree - 使用 Bio.Phylo.write() 将使用 Biopython 生成的自举系统发育树写入文件

Bio.Phylo我在导出带有引导值的 BioPython 树对象(来自 )时遇到问题。这些树是基于距离矩阵在我的 BioPython 脚本中直接创建的。

这些树基本上看起来不错,但是当我使用该Bio.Phylo.write()函数将它们导出到文件(Newick、NEXUS 或 phyloXML 格式)时,引导支持值似乎以错误的格式导出。

树形拓扑可以很好地显示,例如使用 ITOL 或 Dendroscope,但无法显示引导值。

树对象的示例以及生成的 newick 和 phyloxml 文件如下所示。我可以做些什么来导出具有正确(可读)引导值的树?


例子:

这就是 BioPython 中树对象的样子(示例树有 5 个名为 AF 的“物种”):

当我将其导出为 newick 格式 (--> Bio.Phylo.write(mytree,outfile,"newick")) 时,文件最终如下所示:

如您所见,置信度值与内部分支标签连接在一起,因此不可读(例如,名称=“Inner1”和置信度=40.0 的“Inner140.00”)。

在 phyloXML 格式中,树文件如下所示:

这看起来好多了,但树可视化工具(如 ITOL)仍然无法识别置信度值(可能是由于置信度类型 =“未知”标签?)

我能做些什么?修改最终结果文件似乎有风险(如果我真的想要带有“inner”等关键字的叶子标签怎么办?)

另外,我想限制自己使用 BioPython 模块,因为添加额外的外部 Python 模块作为依赖项会使合作伙伴的工具难以实施。

0 投票
1 回答
2643 浏览

python - 在 python 中,如何在使用 Bio.Phylo.draw() 生成系统发育树时更改叶节点的字体大小?

我正在使用 Biopython 的 Phylo 包来创建系统发育树。

对于大树,我需要减小叶节点的字体大小。有人建议更改 matplotlib.pyplot.rcParams['font.size'] 但这仅允许我更改轴名称和标题,因为 Phylo 定义了自己的字体大小。我无法更改 Phylo 源代码,因为我在大学使用它。定义图形或轴不是一个选项,因为 Phylo.draw() 创建了自己的选项。

有没有人对如何解决这个问题有任何建议,也许是拉伸 y 轴?

到目前为止,我使用以下代码来生成树:

阴谋

0 投票
2 回答
415 浏览

r - 查找 R 树 newick 格式的提示

我用猿(read.tree)将Newick树导入R。问题是,当我绘制树时,标签重叠,因为有 1000 个提示。我没有在这里复制树,因为它是一个很长的表达式。有没有办法查看哪个人在树的哪个尖端?

我不认为在 1000 个样本中,它们从 1 到 1000 依次放置在尖端,但是树以某种方式重新排列了它们……所以我需要新的尖端标签序列或其他东西……

树看起来像这样:

![在此处输入图像描述][1]

只需忽略颜色,我将需要能够获得提示的顺序......只需考虑一种情况,其中从底部开始的第一个提示是提示 79,然后是高于 82 的提示,然后是 87 等等.. ..

考虑像这里这样的树

另外,我怎样才能从中获得一个只有尖端标签的向量?