问题标签 [phylogeny]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R:多重回归错误(在需要的地方缺少真/假)
我的 R sessionInfo() 失败运行:
我正在努力隔离哪些变量在交互时导致特定失败。(更新:没有特定的预测器,它只是超过阈值的预测器数量由物种数量决定)
我有一个错误,它似乎是 R 中“caper”包的内部错误。确切的错误是:
使用下面的 7 个预测变量,dataSet1.txt
我发现回归与和完美配合。使用下面的 12 个预测变量,我发现只有“)”有效并且两者都有效并产生上面的错误。这是重现我的错误所需的最少代码:)
)^2
)^3
dataSet2.txt
)^2
)^3
由于占用的空间,我已经编辑了我之前提供的数据。由于现在很明显这个错误是一个普遍问题(见下文),您可以在http://cran.r-project.org/web/packages/caper/vignettes/caper.pdf中找到要检查的数据集
r - 如何从 Caper R 包中的 pgls() 获取学生化残差
我有一个包含 135 个物种、6 个生活史特征(响应)和 2 个环境变量(预测变量)的数据集。我有兴趣使用 Caper 包进行 pgls 回归分析,以查看环境变量对每个生活史特征的影响。由于其中一个性状是女性体重,我计算了每个性状对女性体重的 pgls 回归,并在针对环境变量的多元回归中使用了随后的残差。为了检查回归诊断在针对体重的单变量特征回归中是否正常,我使用了 plot.pgls()。这些图显示了一些异常值的存在。在 Caper 中使用 pgls 的一些论文中,学生化残差 > 3 的数据点已被排除为异常值。
- 有人可以帮我弄清楚如何从 Caper 的 pgls 回归中计算学生化残差吗?
- pgls 回归给出系统发育和非系统发育残差。其中哪一个是学生化残差计算的?
谢谢你的时间和帮助,pb
r - R:减少模型公式后如何更新模型框架
我正在使用 Windows 7 上的 caper 包进行系统发育多元回归,并且在生成简化模型后尝试绘制剩余杠杆图时,我一直收到模型框架/公式不匹配错误。
这是重现错误所需的最少代码:
当我尝试绘制剩余杠杆图以查看模型复杂性的影响时,出现以下错误:
如何更新我的模型框架以再次检查厨师的距离(图形或数字)?
python-2.7 - 使用 Biopython Phylo 将终端重命名为 None
我一直在使用 Biopython 将一些氨基酸序列与 Clustal-Omega 对齐,然后导入生成的树。
因此,导入的树现在有一些名为 None 的叶子/终端,并且缺少等效数量的命名叶子。
我尝试在树上查看文件(由 clustalo 格式化),并注意到被重命名为 none 的基因在它们之后总是有 -0,例如:
-0 是什么意思,我该如何解决这个问题,以便命名我的所有终端?
作为旁注,当我用 DNA 序列填充我的 fasta 文件而不是对齐并导入该树时,它似乎没有发生。
clojure - “rerootable”纯功能树数据结构
我最近购买了 Joseph Felsenstein 的《推断系统发育》,这是一本关于推断系统发育树的数学和计算方法的好书,并且一直在尝试实现它所描述的一些算法。
具体来说,我有兴趣在具有持久性数据结构的功能设置中这样做,因为许多方法都涉及遍历可能的树空间,并且通过结构来廉价地记住我们去过的地方的历史会很好共享(这是 aphyr 在这篇博文中对“世界”所做的事情)、轻松缓存先前计算的子树值等。
这样做的问题是,很多方法都涉及“重新生根”树,我无法弄清楚如何以纯粹的功能方式廉价地做到这一点。基本上我需要一些方法来捕捉以下每一个的想法(使用 clojure 表示法,将树表示为向量):
表示相同的数据,仅在根的位置不同;它们各自代表无根树:
我希望能够使用 zipper 导航到其中一棵树,然后调用一个函数reroot
,该函数将返回一个新树,该树以这样一种方式压缩,即根位于 current loc
。
在书中,Felsenstein 描述了一种用于廉价可重根树的数据结构,它看起来像下面匆忙制作的图表
其中圆圈是结构,箭头是指针。结构环是树上的内部节点,一旦我们引用了一个,我们可以通过一些指针交换将根移到那里。不幸的是,这是一个变异操作,需要相互引用,这两者在纯函数设置中都是不可能的。
我觉得应该有一种方法可以使用拉链做我想做的事,但我已经玩clojure.core/zip
了一段时间了,却一无所获。
有谁知道这样的实现,或者对我应该阅读的东西/我应该看的论文/如何做到这一点的想法有建议?
谢谢!
r - 系统发育祖先重建:指定单向字符状态变化的模型 [ape] [phytools]
假设我有一个系统发育树和我的树的一些字符数据。我知道一个字符是单向的:从 0 到 1 的转变率为正,但从 1 到 0 的转变率为零(例如,0 是二倍体,1 是多倍体)。假设我想对我的树进行祖先重建。我知道我可以使用 Ape 包中的 Ace 或 phytools 包中的 make.simmap 来进行祖先重建,但我不知道如何指定单向字符更改的模型。
例子:
有人知道该怎么做吗?
r - 具有分类变量和 R 中的系统发育树的热图
:)
我有一个问题,通过个人搜索没有找到任何答案。我想用分类变量制作一个热图(有点像这个:类似热图的图,但是对于分类变量),我想在左侧添加一个系统发育树(像这个:如何创建一个具有固定外部层次集群的热图)。理想的情况是改编第二个,因为它看起来更漂亮!;)
这是我的数据:
一个 newick 格式的系统发育树,有 3 个物种,比方说:
/li>一个数据框:
/li>
(其中 A、B 和 C 是分类变量,例如在我的情况下存在/不存在/重复基因)。
你知道怎么做吗?
提前谢谢了!
编辑:我希望能够选择热图中每个类别的颜色,而不是经典的渐变。假设 A=绿色,B=黄色,C=红色
tree - 使用 Bio.Phylo.write() 将使用 Biopython 生成的自举系统发育树写入文件
Bio.Phylo
我在导出带有引导值的 BioPython 树对象(来自 )时遇到问题。这些树是基于距离矩阵在我的 BioPython 脚本中直接创建的。
这些树基本上看起来不错,但是当我使用该Bio.Phylo.write()
函数将它们导出到文件(Newick、NEXUS 或 phyloXML 格式)时,引导支持值似乎以错误的格式导出。
树形拓扑可以很好地显示,例如使用 ITOL 或 Dendroscope,但无法显示引导值。
树对象的示例以及生成的 newick 和 phyloxml 文件如下所示。我可以做些什么来导出具有正确(可读)引导值的树?
例子:
这就是 BioPython 中树对象的样子(示例树有 5 个名为 AF 的“物种”):
当我将其导出为 newick 格式 (--> Bio.Phylo.write(mytree,outfile,"newick")
) 时,文件最终如下所示:
如您所见,置信度值与内部分支标签连接在一起,因此不可读(例如,名称=“Inner1”和置信度=40.0 的“Inner140.00”)。
在 phyloXML 格式中,树文件如下所示:
这看起来好多了,但树可视化工具(如 ITOL)仍然无法识别置信度值(可能是由于置信度类型 =“未知”标签?)
我能做些什么?修改最终结果文件似乎有风险(如果我真的想要带有“inner”等关键字的叶子标签怎么办?)
另外,我想限制自己使用 BioPython 模块,因为添加额外的外部 Python 模块作为依赖项会使合作伙伴的工具难以实施。
python - 在 python 中,如何在使用 Bio.Phylo.draw() 生成系统发育树时更改叶节点的字体大小?
我正在使用 Biopython 的 Phylo 包来创建系统发育树。
对于大树,我需要减小叶节点的字体大小。有人建议更改 matplotlib.pyplot.rcParams['font.size'] 但这仅允许我更改轴名称和标题,因为 Phylo 定义了自己的字体大小。我无法更改 Phylo 源代码,因为我在大学使用它。定义图形或轴不是一个选项,因为 Phylo.draw() 创建了自己的选项。
有没有人对如何解决这个问题有任何建议,也许是拉伸 y 轴?
到目前为止,我使用以下代码来生成树:
r - 查找 R 树 newick 格式的提示
我用猿(read.tree)将Newick树导入R。问题是,当我绘制树时,标签重叠,因为有 1000 个提示。我没有在这里复制树,因为它是一个很长的表达式。有没有办法查看哪个人在树的哪个尖端?
我不认为在 1000 个样本中,它们从 1 到 1000 依次放置在尖端,但是树以某种方式重新排列了它们……所以我需要新的尖端标签序列或其他东西……
树看起来像这样:
![在此处输入图像描述][1]
只需忽略颜色,我将需要能够获得提示的顺序......只需考虑一种情况,其中从底部开始的第一个提示是提示 79,然后是高于 82 的提示,然后是 87 等等.. ..
考虑像这里这样的树
另外,我怎样才能从中获得一个只有尖端标签的向量?