“phylogeny”的相关标签问题

0 投票

1 回答

106 浏览

r - R：多重回归错误（在需要的地方缺少真/假）

我的 R sessionInfo() 失败运行：

我正在努力隔离哪些变量在交互时导致特定失败。（更新：没有特定的预测器，它只是超过阈值的预测器数量由物种数量决定）

我有一个错误，它似乎是 R 中“caper”包的内部错误。确切的错误是：

使用下面的 7 个预测变量，dataSet1.txt我发现回归与和完美配合。使用下面的 12 个预测变量，我发现只有“）”有效并且两者都有效并产生上面的错误。这是重现我的错误所需的最少代码：))^2)^3dataSet2.txt)^2)^3

由于占用的空间，我已经编辑了我之前提供的数据。由于现在很明显这个错误是一个普遍问题（见下文），您可以在http://cran.r-project.org/web/packages/caper/vignettes/caper.pdf中找到要检查的数据集

r regression phylogeny

2015-02-04T17:00:51.980

0 投票

1 回答

786 浏览

r - 如何从 Caper R 包中的 pgls() 获取学生化残差

我有一个包含 135 个物种、6 个生活史特征（响应）和 2 个环境变量（预测变量）的数据集。我有兴趣使用 Caper 包进行 pgls 回归分析，以查看环境变量对每个生活史特征的影响。由于其中一个性状是女性体重，我计算了每个性状对女性体重的 pgls 回归，并在针对环境变量的多元回归中使用了随后的残差。为了检查回归诊断在针对体重的单变量特征回归中是否正常，我使用了 plot.pgls()。这些图显示了一些异常值的存在。在 Caper 中使用 pgls 的一些论文中，学生化残差 > 3 的数据点已被排除为异常值。

有人可以帮我弄清楚如何从 Caper 的 pgls 回归中计算学生化残差吗？
pgls 回归给出系统发育和非系统发育残差。其中哪一个是学生化残差计算的？

谢谢你的时间和帮助，pb

r regression phylogeny

2015-02-07T01:57:05.823

0 投票

1 回答

848 浏览

r - R：减少模型公式后如何更新模型框架

我正在使用 Windows 7 上的 caper 包进行系统发育多元回归，并且在生成简化模型后尝试绘制剩余杠杆图时，我一直收到模型框架/公式不匹配错误。

这是重现错误所需的最少代码：

当我尝试绘制剩余杠杆图以查看模型复杂性的影响时，出现以下错误：

如何更新我的模型框架以再次检查厨师的距离（图形或数字）？

r linear-regression phylogeny

2015-02-08T20:36:55.433

0 投票

0 回答

148 浏览

python-2.7 - 使用 Biopython Phylo 将终端重命名为 None

我一直在使用 Biopython 将一些氨基酸序列与 Clustal-Omega 对齐，然后导入生成的树。

因此，导入的树现在有一些名为 None 的叶子/终端，并且缺少等效数量的命名叶子。

我尝试在树上查看文件（由 clustalo 格式化），并注意到被重命名为 none 的基因在它们之后总是有 -0，例如：

-0 是什么意思，我该如何解决这个问题，以便命名我的所有终端？

作为旁注，当我用 DNA 序列填充我的 fasta 文件而不是对齐并导入该树时，它似乎没有发生。

python-2.7 biopython phylogeny clustal

2015-02-19T15:09:32.173

0 投票

2 回答

325 浏览

clojure - “rerootable”纯功能树数据结构

我最近购买了 Joseph Felsenstein 的《推断系统发育》，这是一本关于推断系统发育树的数学和计算方法的好书，并且一直在尝试实现它所描述的一些算法。

具体来说，我有兴趣在具有持久性数据结构的功能设置中这样做，因为许多方法都涉及遍历可能的树空间，并且通过结构来廉价地记住我们去过的地方的历史会很好共享（这是 aphyr 在这篇博文中对“世界”所做的事情）、轻松缓存先前计算的子树值等。

这样做的问题是，很多方法都涉及“重新生根”树，我无法弄清楚如何以纯粹的功能方式廉价地做到这一点。基本上我需要一些方法来捕捉以下每一个的想法（使用 clojure 表示法，将树表示为向量）：

表示相同的数据，仅在根的位置不同；它们各自代表无根树：

我希望能够使用 zipper 导航到其中一棵树，然后调用一个函数reroot，该函数将返回一个新树，该树以这样一种方式压缩，即根位于 current loc。

在书中，Felsenstein 描述了一种用于廉价可重根树的数据结构，它看起来像下面匆忙制作的图表

可怕的图表

其中圆圈是结构，箭头是指针。结构环是树上的内部节点，一旦我们引用了一个，我们可以通过一些指针交换将根移到那里。不幸的是，这是一个变异操作，需要相互引用，这两者在纯函数设置中都是不可能的。

我觉得应该有一种方法可以使用拉链做我想做的事，但我已经玩clojure.core/zip了一段时间了，却一无所获。

有谁知道这样的实现，或者对我应该阅读的东西/我应该看的论文/如何做到这一点的想法有建议？

谢谢！

clojure tree functional-programming purely-functional phylogeny

2015-02-22T19:34:19.047

0 投票

1 回答

449 浏览

r - 系统发育祖先重建：指定单向字符状态变化的模型 [ape] [phytools]

假设我有一个系统发育树和我的树的一些字符数据。我知道一个字符是单向的：从 0 到 1 的转变率为正，但从 1 到 0 的转变率为零（例如，0 是二倍体，1 是多倍体）。假设我想对我的树进行祖先重建。我知道我可以使用 Ape 包中的 Ace 或 phytools 包中的 make.simmap 来进行祖先重建，但我不知道如何指定单向字符更改的模型。

例子：

有人知道该怎么做吗？

r phylogeny ape-phylo

2015-03-05T17:09:36.160

0 投票

2 回答

2701 浏览

r - 具有分类变量和 R 中的系统发育树的热图

:)

我有一个问题，通过个人搜索没有找到任何答案。我想用分类变量制作一个热图（有点像这个：类似热图的图，但是对于分类变量），我想在左侧添加一个系统发育树（像这个：如何创建一个具有固定外部层次集群的热图）。理想的情况是改编第二个，因为它看起来更漂亮！;)

这是我的数据：

一个 newick 格式的系统发育树，有 3 个物种，比方说：
/li>
一个数据框：
/li>

（其中 A、B 和 C 是分类变量，例如在我的情况下存在/不存在/重复基因）。

你知道怎么做吗？

提前谢谢了！

编辑：我希望能够选择热图中每个类别的颜色，而不是经典的渐变。假设 A=绿色，B=黄色，C=红色

r heatmap categorical-data phylogeny

2015-03-12T09:24:29.757

0 投票

1 回答

1053 浏览

tree - 使用 Bio.Phylo.write() 将使用 Biopython 生成的自举系统发育树写入文件

Bio.Phylo我在导出带有引导值的 BioPython 树对象（来自）时遇到问题。这些树是基于距离矩阵在我的 BioPython 脚本中直接创建的。

这些树基本上看起来不错，但是当我使用该Bio.Phylo.write()函数将它们导出到文件（Newick、NEXUS 或 phyloXML 格式）时，引导支持值似乎以错误的格式导出。

树形拓扑可以很好地显示，例如使用 ITOL 或 Dendroscope，但无法显示引导值。

树对象的示例以及生成的 newick 和 phyloxml 文件如下所示。我可以做些什么来导出具有正确（可读）引导值的树？

例子：

这就是 BioPython 中树对象的样子（示例树有 5 个名为 AF 的“物种”）：

当我将其导出为 newick 格式 (--> Bio.Phylo.write(mytree,outfile,"newick")) 时，文件最终如下所示：

如您所见，置信度值与内部分支标签连接在一起，因此不可读（例如，名称=“Inner1”和置信度=40.0 的“Inner140.00”）。

在 phyloXML 格式中，树文件如下所示：

这看起来好多了，但树可视化工具（如 ITOL）仍然无法识别置信度值（可能是由于置信度类型 =“未知”标签？）

我能做些什么？修改最终结果文件似乎有风险（如果我真的想要带有“inner”等关键字的叶子标签怎么办？）

另外，我想限制自己使用 BioPython 模块，因为添加额外的外部 Python 模块作为依赖项会使合作伙伴的工具难以实施。

tree format biopython statistics-bootstrap phylogeny

2015-03-18T15:24:28.757

0 投票

1 回答

2643 浏览

python - 在 python 中，如何在使用 Bio.Phylo.draw() 生成系统发育树时更改叶节点的字体大小？

我正在使用 Biopython 的 Phylo 包来创建系统发育树。

对于大树，我需要减小叶节点的字体大小。有人建议更改 matplotlib.pyplot.rcParams['font.size'] 但这仅允许我更改轴名称和标题，因为 Phylo 定义了自己的字体大小。我无法更改 Phylo 源代码，因为我在大学使用它。定义图形或轴不是一个选项，因为 Phylo.draw() 创建了自己的选项。

有没有人对如何解决这个问题有任何建议，也许是拉伸 y 轴？

到目前为止，我使用以下代码来生成树：

python tree draw biopython phylogeny

2015-04-02T18:30:08.063

0 投票

2 回答

415 浏览

r - 查找 R 树 newick 格式的提示

我用猿（read.tree）将Newick树导入R。问题是，当我绘制树时，标签重叠，因为有 1000 个提示。我没有在这里复制树，因为它是一个很长的表达式。有没有办法查看哪个人在树的哪个尖端？

我不认为在 1000 个样本中，它们从 1 到 1000 依次放置在尖端，但是树以某种方式重新排列了它们……所以我需要新的尖端标签序列或其他东西……

树看起来像这样：

![在此处输入图像描述][1]

只需忽略颜色，我将需要能够获得提示的顺序......只需考虑一种情况，其中从底部开始的第一个提示是提示 79，然后是高于 82 的提示，然后是 87 等等.. ..

考虑像这里这样的树

另外，我怎样才能从中获得一个只有尖端标签的向量？

r tree phylogeny

2015-04-18T09:46:22.103

问题标签 [phylogeny]

Reference