问题标签 [mothur]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R包重塑函数融化错误:使用很多因素时在数据中找不到id变量
我正在使用mothur的稀疏输出,它基本上为我提供了一个数据集,其中包含采样的序列数和多个样本中的唯一序列数。我想使用 ggplot2 来可视化这些数据,因此需要使用melt
从 awide
到long
格式。
问题是由于melt
. 这基本上说明
错误:在数据中找不到 id 变量:1、3、6、(...等等)
由于原始数据集的大小,在这里共享它是不切实际的,但是应该能够使用以下代码重新创建相同的问题:
这给出了完全相同的错误:
错误:在数据中找不到 id 变量:0,3,6,9, (...)
我看不到我做错了什么。我在 ubuntu 服务器 12.04 上使用 R 2.15.1。函数reshape::melt
和reshape2::melt
结果都导致相同的错误。
powershell - 将文件中的选定行作为第一列输出,将文件名作为第二列输出
我最近才开始在 win7 中使用 powershell,以便为程序 mothur 生成类似管道的脚本。在我在 ubuntu 中使用 bash 脚本来执行此操作之前。我很高兴现在一切正常,除了一项任务:
我想格式化一个fasta文件,格式如下:
到一个制表符分隔的文件,看起来像这样
重要的是输出文件的第一列包含不带“>”符号的名称。第二个由制表符分隔的列是原始文件名.fasta,没有后缀(“文件名”)。我有解决方案 gci 来读出文件的基本名称和 Select-String 来输出所有以“>”开头的行。唯一的问题是两列中的格式和第二列中文件名的不断重复。
到目前为止我已经尝试过:
生成一个文件,该文件仅包含包含“>”符号的行。之后我只是更换了它们。我得到的文件名
r - R:调用系统命令
我试图使用系统命令从 R 代码中调用可执行文件。如果我在终端中使用命令行调用 R,然后执行system("mothur")
. 但是,如果从 R 脚本(在 RStudio 上)中执行相同的命令,我会得到:sh: mothur: command not found
.
在这两种情况下,当前工作目录都是相同的。
我需要以不同的方式调用命令吗?
谢谢!
r - 无法将 mothur 树导入 R
我用 mothur 建了一棵树,它生成了一个 newick 格式文件,这里是树文件:
当我尝试使用 import_mothur {phyloseq} 将其导入 R 时,它给了我错误
我查看了这个树文件,找不到任何重复的名称。我在 mothur 中使用了不同的数据集(序列数据),但使用了相同的方法,这很有效。我只是不明白这个文件有什么问题?
谢谢!!!!
r - 在R中转换/转换丰度(OTU)表/data.frame(到fasta文件)
我目前正在处理一个大型数据集,到目前为止,我可以通过无数的谷歌搜索和长时间的尝试和错误会话很好地解决我所有的想法/问题。我已经设法使用 plyr 和 reshape 函数对我的不同数据集进行一些转换并学到了很多东西,但我认为我已经达到了我目前的 R 知识不再帮助我的地步。
即使我的问题听起来非常具体(即 OTU 表和 fasta 文件),我想我的尝试是跨许多不同领域(而不仅仅是生物信息学)的通用 R 应用程序。
现在,我已经将一个参考序列文件与一个丰度表合并,我想根据这个data.frame的信息生成一个特定的文件——一个fasta文件。
我的 df 目前看起来有点像这样:
生成的文件应如下所示:
如您所见,我想使用有关每个样本(即 sw.n)的(参考)序列数量的信息来创建(fasta)文件。
我没有使用 R 中的循环的经验(我只在简单的处理尝试期间使用基本循环),但我认为这可以解决问题。我从SeqinR 包中找到了write.fasta函数,但在那里找不到任何解决方案。mothur中的deunique.seqs命令不起作用,因为它需要一个 fasta 文件作为输入(我显然没有)。Bioconductor (OTUbase?)上很有可能有一些东西,但老实说,我不知道从哪里开始,我很高兴有任何帮助。我真的很想在 R 中做这件事,因为我喜欢使用它,但也非常欢迎任何其他想法。
//小编辑:
下面的两个答案都很好用(请参阅我的评论) - 我还发现了两种可能的不太优雅和非 R 的解决方法(尚未测试):
- 因为我已经有了分类文件和丰富的 OTU 表,我认为 mothur 命令make.biom可以用来创建biom-format 文件。我还没有使用 biom 文件,但我认为有一些工具和脚本可用于将 biom 文件数据再次保存为 fasta
- 将 Qiime 文件转换为 oligotyping 格式- 这还需要一个分类文件和一个 Otu 表
不确定这两种方式是否有效 - 因此,如果我错了,请纠正我。
r - 按平均值合并并绘制表格中的备用数据
我使用estimateR (vegan) 从 mothur 输出生成此表。但是,到目前为止,我无法继续这样做,因为我不知道如何从表格中绘图......
我希望我能更精通 R,但我正在努力执行两项任务:
(对不起,列表很大)
提前感谢您提供的任何帮助!
干杯! 安德烈
r - Tax4Fun - 'dimnames' [1] 的错误长度不等于数组范围
我正在尝试运行 Tax4Fun 从 16S 数据中预测功能。由于到目前为止的分析是在 Mothur 中进行的,因此我无法使用 biom 作为输入(我事先知道 biom 版本之间的不兼容)。
我将 mothur biom 文件转换为 tsv 文件,如下所示:
biom convert -i *biom -o otu_table.txt --header-key taxonomy --table-type "OTU table" --to-tsv
otu_table.txt 文件随后与 Tax4Fun 一起使用:
data<-importQIIMEData("otu_table.txt")
folderReferenceData<- "/nobackup/shared/cgebm/r_packages/Tax4Fun/SILVA119/"
results <- Tax4Fun(data,folderReferenceData)
但是我收到以下错误消息:rownames<-
( *tmp*
, value = c("NC-1.S34", "NC-2.S48", "PC-1.S27", : length of 'dimnames' [1] not等于数组范围
我已经广泛搜索了谷歌,但没有找到解决方案!文本文件具有我期望的尺寸,并且在加载到 R 时似乎没问题。
欢迎所有建议!
r - 如何从R中的距离矩阵生成排序图
这里我有另一个“图形”问题:
我从 MOTHUR 获得了以下距离矩阵(来自加权 unifrac 分析):
由于这个距离矩阵来自 PCoA,我想要做的是用 R 在排序图中绘制这些距离。
关于如何做到这一点的任何想法?
非常感谢
mothur - 我开始使用 mothur 版本 - v.1.36.1-,但我收到了一些错误消息(如下所示)。我怎样才能克服这个?
我开始 Mothur 教程 ( https://www.mothur.org/wiki/MiSeq_SOP )。但是从一开始,我在 mothur* 中创建“make.file”时收到了一些错误消息(错误命令如下所示)。我更改了参数,但结果是否定的。我怎么解决这个问题?
bash - 在 GNU Parallel 日志报告中包含命令屏幕输出
我有一个脚本使用 GNU Parallel 多次调用另一个脚本。这是我的并行化代码的重要部分:
这里调用了 MOTHUR_run.sh 脚本:
我想以相同的执行顺序将修剪屏幕输出包含在并行日志文件中。echo 部分工作正常,mothur 命令还自动将它们的屏幕输出包含在日志文件中。
有任何想法吗?