问题标签 [rna-seq]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
38 浏览

r - 提取仅出现在 List 1 和 List 2 中的基因列表

我有两个差异表达基因列表,一个来自敲除 A 与对照,另一个来自敲除 B 与对照细胞。然而,该列表显示在 KOA 中表达的基因与在 KOB 中表达的基因略有不同,因此我想创建一个最终列表,其中仅包含那些同时出现在 KOA 和 KOB 中但又不相互排斥的基因。两个基因列表具有相同的列名并包含在 .csv 文件中。

由于我完全迷失了,我将如何在 R 中解决这个问题。

谢谢,-Yaseen

0 投票
1 回答
866 浏览

multithreading - GNU 并行的最佳线程数

我想我有一个相当基本的问题。我刚刚发现了 GNU 并行包,我认为我的工作流程真的可以从中受益!我正在使用一个循环遍历我的读取文件并生成所需的输出。每次读取执行的命令如下所示:

STAR --runThreadN 8 --genomeDir star_index/ --readFilesIn R1.fq R2.fq

如您所见,我指定了 8 个线程,这是我的虚拟机拥有的线程数。

我现在的问题如下:如果我将 GNU 与这样的命令并行使用:

cat reads| parallel -j 3 STAR --runThreadN 8 --genomeDir star_index/ --readFilesIn {}_R1.fq {}_R2.fq

如果我并行执行 3 个作业,我的虚拟机能否处理我指定的线程数?

还是我需要 24 个线程(3*8 个线程)才能正确执行此命令?

如果这是一个基本问题,我很抱歉,我对这个领域很陌生,非常感谢任何帮助!

0 投票
1 回答
54 浏览

r - 为什么 makeCATdb 函数不起作用?

我正在尝试在 R 中进行 GO 术语富集分析。我遵循了本教程。当我走到这一步...

...我收到此错误:

makeCATdb 中的错误(myfile = “GOannotationsBiomark_mod.txt”,lib = “NULL”,:找不到函数“makeCATdb”

我尝试安装 systemPipeRdata 并得到了同样的错误。请问这个功能怎么安装?谢谢!

0 投票
1 回答
79 浏览

r - DESeq2 设计矩阵,包括 RIN 作为公式中的协变量

我一直在关注最后一个 DESeq2 管道来执行 RNAseq 分析。我的问题是实验样品的 rin 与对照样品相比非常低。我阅读了一篇论文,其中他们使用时间过程 RNA 降解进行 RNAseq 分析,并得出结论,将 RIN 值作为协变量包括在内可以减轻样本中低 rin 的一些影响。

我的问题是我应该如何在 DESeq2 对象中构造设计:

我找不到合适的资源来解释如何构建这些模型(我是该领域的新手......)并且我认识到我用这些东西撞到了墙上。我也很感激一些好的资源链接,以便能够理解哪个是正确的以及为什么。

太感谢了

0 投票
1 回答
191 浏览

r - 生成 fastQC 报告

我正在使用fastqcrR 包生成用于 RNAseq 分析的 fastq 文件的多 qc 和单 qc 报告。虽然我的 mlti-qc 报告工作正常,但我在尝试从 fastqc 结果压缩文件生成单个 qc 报告时发现以下错误。

开关错误(状态,PASS = “#00AFBB”,WARN = “#E7B800”,FAIL = “#FC4E07”):EXPR 必须是长度为 1 的向量

我正在使用的代码是

第 6 步 - 构建最终报告
它创建一个 HTML 文件,其中包含一个或多个样品的 FastQC 报告。

有人可以帮我解决这个问题。
谢谢

0 投票
1 回答
326 浏览

r - 同时对多个数据集进行 Wilcoxon 测试

我有一个关于我是否可以在循环中对所有生成的表进行 Wilcoxon 测试的问题。

基本上,我想在每个数据集的 2 个变量之间进行配对 Wilcoxon 检验,并且每个数据集的 2 个变量位于相同的位置(如第 x 列和第 y 列)。(对于熟悉生物学的人来说,实际上这是一些重复元素的控制样本和处理样本之间的 RPKM 值)我希望我可以为每个数据集的 Wilcoxon 检验生成一个 p 值表。

我准备好使用以下代码生成所有表/数据集/数据框,我想我想对每个数据集进行 Wilcoxon 测试,所以我认为我需要继续循环,但我不知道该怎么做:

这是单个数据集的结构:所以基本上我想在变量“R009_initial_filter_rpkm”和“normal_filter_rpkm”之间进行 Wilcoxon 测试

如果我使用了不正确的术语,我很抱歉,因为我是 R 的新手,非常感谢你的帮助

0 投票
1 回答
404 浏览

r - RNA-seq - R - 如何将基因长度导入 RPKM calc 的数据集

因此,原则上标准化原始计数 RNAseq 文件非常简单......

但是我的原始计数文件不伴随基因长度。

我如何/从哪里可以导入基因长度并将其与集合 ID 匹配?我正在使用来自 cpm 值的 EdgeR rpkm,它返回

“rpkm.default(x_cpm) 中的错误:缺少参数“gene.length”,没有默认值”

谢谢

0 投票
1 回答
50 浏览

r - Bioconductor 单细胞 RNA seq 错误,assayData() 函数不起作用,为什么?

我正在遵循论文“单细胞 RNA 测序的生物导体工作流程:标准化、降维、聚类和谱系推断”中的代码。但是我在预处理步骤中遇到了功能测定数据()的错误。这是论文的链接:https ://www.bioconductor.org/help/course-materials/2017/BioC2017/Day2/Workshops/singleCell/doc/workshop.html#introduction

我通过以下代码:

该文件已成功下载并解压缩,但我遇到错误:AssayData(CufflinkseSet)$exprs = NULL 中的错误:找不到对象'CufflinkseSet'。任何人都可以帮助我吗?太感谢了。

0 投票
1 回答
942 浏览

r - NormalizeData.default 在 R 中的集成 seurat 对象上运行 DoubletFinder 时出错

我正在尝试在由各种数据集集成产生的 seurat 对象上运行 DoubletFinder。

Seurat 对象有 2 个分析:RNA 和集成。

集成的 seurat 对象已被完全处理:

  • 归一化和 FindVariableFeature 预集成

  • 集成对象上的 ScaleData、RunPCA、FindNeighbors、FindClusters、RunUMAP。

DoubletFinder 的 paramSweep_v3() 函数给出以下输出:

为什么这表明我的 Seurat 对象中没有插槽?

0 投票
1 回答
112 浏览

r - 使用 R 从 RNAseq 结果摘要文件中提取多个基因集的数据

我正在尝试从 RNAseq 结果摘要文件中提取几个基因集的数据:

在此处输入图像描述

示例基因列表:

在此处输入图像描述

我正在使用 Excel 首先突出显示重复的基因,对摘要文件进行排序,然后复制我需要的数据。这很耗时,而且 Excel 在排序时总是“冻结”,尤其是对于大基因列表。

我想知道 R 是否可以做得更好。如果 R 可以成为更好的解决方案,有人可以提供代码吗?