问题标签 [phyloseq]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
345 浏览

r - 计算组之间的距离(使用 UniFrac 或 Bray-Curtis 进行组比较)

我想问一下如何使用 R 中的加权 UniFrac 或 Bray-Curtis 方法计算组之间的距离。我已经使用 UniFrac 方法得到了每个样本之间的距离。

距离结果表为:

我想计算 A、B 和 C 组之间的距离,最终我想要一个距离表,例如“d5”。

哪个函数适合获得 R 中组之间的计算距离表?

0 投票
1 回答
165 浏览

r - 从 R 中的 Earth Microbiome Project (release1) 导入 .biom 文件时出现问题

我想在 R 中导入我从 ftp 服务器下载的 .biom 文件 - Earth Microbiome Project (release 1)。

该文件来自以下链接: ftp: //ftp.microbio.me/emp/release1/otu_tables/closed_ref_silva/ 我尝试了其中几个文件,但我想在 R(工作室)中导入的是第一个: 'emp_cr_silva_16S_123.qc_filtered.biom' (293MB)

我尝试了几件事:

  1. 我尝试使用 phyloseq::import_biome 和 bioformat::read_biom 函数打开它:

我收到以下错误消息:

  1. 然后,我使用“fs”包的 is_file 函数检查了文件路径和名称。

  2. 然后我检查了我要导入的 .biom 文件,用记事本打开这个 .biom 文件显示奇怪的字符(对不起,我不熟悉开发),例如:

    ƒOB§ß;}]0v(ÿQ<ãï8 #OÅ+q8‚´'Ž;º‹ë®Ü-¯§-‡ùP

我查看了我拥有的其他 biom 文件,但没有一个看起来像这样。我尝试使用相同的功能打开这些其他文件并且它可以工作。

我试图从其他存储库(https://zenodo.org/record/890000)获取此文件,但有类似的问题。

问题很可能来自文件格式,但我不知道如何处理。

0 投票
0 回答
463 浏览

r - 如何将物种箭头/向量添加到排序图中

我使用 Rphyloseq函数纵坐标和plot_ordination一个phyloseq对象和一个先前计算的距离矩阵(未加权的 UniFrac 距离)作为输入,制作了微生物组数据的排序图。我想添加一些箭头来指示哪些物种的相对丰度主要驱动样本之间沿轴的距离。

使用 score 函数添加分数或specscores.dbrda无效。还有其他方法可以添加这些箭头/矢量吗?

这是我使用的代码:

第一部分工作正常,scores 函数返回此错误:

我也尝试过没有单独的距离矩阵,在纵坐标内计算(默认)Bray-Curtis 距离,但我仍然得到相同的错误:

MDS <-纵坐标(physeqobject,“MDS”)

0 投票
1 回答
176 浏览

r - 使用 tree_layout() 获取无根树的结构

有没有办法用phyloseq::tree_layout()函数获取无根树的结构?

使用tree_layout()将为您提供构成下面绘制的树的节点和段的坐标。然后,您可以轻松地重绘该树。

但是如果你想重绘这棵树怎么办:plot.phylo(tree.owls,type = 'u'). 你会怎么做?

0 投票
1 回答
402 浏览

r - R phyloseq中的有效子集忽略缺失的参数

我在phyloseq工作中使用了很多。我的数据集通常包含多个条件或参数,需要以相同的方式进行分析(例如,夏季或冬季的细菌和 Lake1 或 Lake2 的相同图),所以我想为此使用函数。我写了一个子集函数,它允许我通过循环组合多个参数。输出存储在列表中以供进一步分析。

但是,这似乎很笨拙。所以我的第一个问题是关于功能的改进。

1)具体来说,我想知道是否

a) 使用多个for loops来生成子集是一个好主意。

b) 此外,可以优化for loops和的组合。lapply

c)也许有更好的方法来防止现有列表再次无法识别地附加相同对象的新迭代?我实现了这一点,因为我在开发代码时有很多很多测试执行

这里讨论了 for 循环是否比 apply 慢:lapply vs for loop - Performance R

我认为phyloseq内部调用which,所以它不必是一个phyloseq特定的解决方案。

2)我的第二个问题是如何处理这种情况,如果不是所有搜索参数都存在于所有子集中?所以在下面的例子中,如果没有丹麦男性,“丹麦”和“M”的组合就会中断。我想避免这种情况,在这个例子中只有 3 个(丹麦 x F,美国 x F,美国 x M)而不是 4 个子集。目前,该函数需要适应每个特殊的子集,这首先破坏了编写它的目的。

0 投票
1 回答
214 浏览

r - 函数中使用的 R phyloseq tax_glom 给出错误

我正在尝试创建一个函数,以使用 PHYLOSEQ 获取任何给定分类等级的相对丰富的表格,例如:

所以当我像这样使用它时: TABLE <- Relative_Table(PHYLO_Obj, Phylum) 它给了我一个错误:

tax_glom(PhyloObj, taxrank = "TaxonRank") 错误:taxrank 参数错误。必须在 rank_names(physeq) 的值之间

然而,当我在函数内部使用 taxrank 时,它运行良好:

第一个选项有什么问题??,我只想在函数中使用任何给定的taxrank(Phylum,Class....... Genus)并生成一个表!!!!

谢谢

0 投票
1 回答
1605 浏览

r - 将 R 中的现有数据转换为 Phyloseq OTU 表

我一直在尝试“phyloseq-ize”我的 asv_table、a​​sv_id 和元数据以进行 16S 分析,使用 qiime2 创建并使用read.table(). 我已经能够成功地导入我的 asv_id 和元数据(分别使用tax_table()sample_data()),但我正在努力处理我的 asv_table。

我的 asv_table 的结构是一个数据框,其中包含我的分类单元的标题,我的行是样本(我也尝试使用转置数据进行此操作,其中我的分类单元是行,我的样本是列)。我最初的尝试很简单:

然而这产生了:

这导致我尝试将我的数据类更改为数字,并尝试再次导入:

我担心这是一个兔子洞,因为一个更简单的解决方案让我眼前一亮(我很难在互联网上研究我的问题......通常表明我创造了一个没有人遇到过的独特问题)。

我将不胜感激有关该主题的任何指导或帮助!

先感谢您。

0 投票
1 回答
3469 浏览

r - Phyloseq,如何通过 merge_samples 获得相对丰度?

我正在尝试使用 Phyloseq 包的 merge_sample 选项获得相对丰度。

当我用所有样本计算每个 Phylum 的平均值时(我将以 GlobalPatterns 为例);我的意思是,Globalpaters 有 26 个样本,所以我做了类似的东西

我得到类似的东西:

我觉得还可以!!!!

但是,当我托盘法师merge_samples(通过:SampleType):

我得到相同的税,但在平均值列中具有不同的百分比:

在这一点上,通过 SampleType 的 merge_samples,每一列(样本)都会使分类群变得模糊,并且每个样本中每个门的百分比会发生变化(粪便淡水淡水......),我理解这一点,但每个门的总体平均值必须相同,即使我合并样本,在这种情况下,平均值也不同(Proteobacteria 30.57,Firmicutes 16.9,Bacteroidetes 16.29 ......)。

任何解决方案或建议????

谢谢

0 投票
1 回答
222 浏览

r - 如何在 R 数据查看器中显示带有因子的数据框?

我有一个包含数据框的类,其中列是因子(来自 phyloseq 包)。它看起来像这样:

我可以毫无问题地在控制台中查看数据,但想在数据查看器中检查它。但是,如果我尝试这样做,我只会得到一个显示列名、列类型(即“因子”)以及所述因子的级别的表,如下所示

我对 R 有点陌生,并尝试了以下方法:

我怀疑我在 S4 类及其语法方面缺乏一些知识,你能告诉我如何在数据查看器中显示实际数据吗?

0 投票
1 回答
47 浏览

r - 如何在 R 上将患病人群细分为性别 - 微生物组

我是 R 新手。我正在使用一个脚本,该脚本根据国家/地区将 atlas1006 微生物组数据分成 3 组疾病流行率(低、中、高)。我想将每组细分:低、中、高,每组分为男性和女性,即低男、低女、中男、中女、高男、高女。我也想保持现有的 3 个组低、中、高。这是将数据拆分为低、中、高的代码:

关于如何从这里进行性别分离的任何想法?