“rna-seq”的相关标签问题_Stack Overflow中文网

0 投票

0 回答

38 浏览

r - 提取仅出现在 List 1 和 List 2 中的基因列表

我有两个差异表达基因列表，一个来自敲除 A 与对照，另一个来自敲除 B 与对照细胞。然而，该列表显示在 KOA 中表达的基因与在 KOB 中表达的基因略有不同，因此我想创建一个最终列表，其中仅包含那些同时出现在 KOA 和 KOB 中但又不相互排斥的基因。两个基因列表具有相同的列名并包含在 .csv 文件中。

由于我完全迷失了，我将如何在 R 中解决这个问题。

谢谢，-Yaseen

r rna-seq

2020-05-04T09:13:24.703

0 投票

1 回答

866 浏览

multithreading - GNU 并行的最佳线程数

我想我有一个相当基本的问题。我刚刚发现了 GNU 并行包，我认为我的工作流程真的可以从中受益！我正在使用一个循环遍历我的读取文件并生成所需的输出。每次读取执行的命令如下所示：

STAR --runThreadN 8 --genomeDir star_index/ --readFilesIn R1.fq R2.fq

如您所见，我指定了 8 个线程，这是我的虚拟机拥有的线程数。

我现在的问题如下：如果我将 GNU 与这样的命令并行使用：

cat reads| parallel -j 3 STAR --runThreadN 8 --genomeDir star_index/ --readFilesIn {}_R1.fq {}_R2.fq

如果我并行执行 3 个作业，我的虚拟机能否处理我指定的线程数？

还是我需要 24 个线程（3*8 个线程）才能正确执行此命令？

如果这是一个基本问题，我很抱歉，我对这个领域很陌生，非常感谢任何帮助！

2020-05-05T10:58:16.770

0 投票

1 回答

54 浏览

r - 为什么 makeCATdb 函数不起作用？

我正在尝试在 R 中进行 GO 术语富集分析。我遵循了本教程。当我走到这一步...

...我收到此错误：

makeCATdb 中的错误（myfile = “GOannotationsBiomark_mod.txt”，lib = “NULL”，：找不到函数“makeCATdb”

我尝试安装 systemPipeRdata 并得到了同样的错误。请问这个功能怎么安装？谢谢！

r rna-seq

2020-05-12T00:04:15.480

0 投票

1 回答

79 浏览

r - DESeq2 设计矩阵，包括 RIN 作为公式中的协变量

我一直在关注最后一个 DESeq2 管道来执行 RNAseq 分析。我的问题是实验样品的 rin 与对照样品相比非常低。我阅读了一篇论文，其中他们使用时间过程 RNA 降解进行 RNAseq 分析，并得出结论，将 RIN 值作为协变量包括在内可以减轻样本中低 rin 的一些影响。

我的问题是我应该如何在 DESeq2 对象中构造设计：

我找不到合适的资源来解释如何构建这些模型（我是该领域的新手......）并且我认识到我用这些东西撞到了墙上。我也很感激一些好的资源链接，以便能够理解哪个是正确的以及为什么。

太感谢了

r glm linearmodels rna-seq

2020-05-18T16:30:10.117

0 投票

1 回答

191 浏览

r - 生成 fastQC 报告

我正在使用fastqcrR 包生成用于 RNAseq 分析的 fastq 文件的多 qc 和单 qc 报告。虽然我的 mlti-qc 报告工作正常，但我在尝试从 fastqc 结果压缩文件生成单个 qc 报告时发现以下错误。

开关错误（状态，PASS = “#00AFBB”，WARN = “#E7B800”，FAIL = “#FC4E07”）：EXPR 必须是长度为 1 的向量

我正在使用的代码是

第 6 步 - 构建最终报告
它创建一个 HTML 文件，其中包含一个或多个样品的 FastQC 报告。

有人可以帮我解决这个问题。
谢谢

r fastq rna-seq

2020-05-25T08:16:54.303

0 投票

1 回答

326 浏览

r - 同时对多个数据集进行 Wilcoxon 测试

我有一个关于我是否可以在循环中对所有生成的表进行 Wilcoxon 测试的问题。

基本上，我想在每个数据集的 2 个变量之间进行配对 Wilcoxon 检验，并且每个数据集的 2 个变量位于相同的位置（如第 x 列和第 y 列）。（对于熟悉生物学的人来说，实际上这是一些重复元素的控制样本和处理样本之间的 RPKM 值）我希望我可以为每个数据集的 Wilcoxon 检验生成一个 p 值表。

我准备好使用以下代码生成所有表/数据集/数据框，我想我想对每个数据集进行 Wilcoxon 测试，所以我认为我需要继续循环，但我不知道该怎么做：

这是单个数据集的结构：所以基本上我想在变量“R009_initial_filter_rpkm”和“normal_filter_rpkm”之间进行 Wilcoxon 测试

如果我使用了不正确的术语，我很抱歉，因为我是 R 的新手，非常感谢你的帮助

r loops statistics filtering rna-seq

2020-05-27T02:36:36.247

0 投票

1 回答

404 浏览

r - RNA-seq - R - 如何将基因长度导入 RPKM calc 的数据集

因此，原则上标准化原始计数 RNAseq 文件非常简单......

但是我的原始计数文件不伴随基因长度。

我如何/从哪里可以导入基因长度并将其与集合 ID 匹配？我正在使用来自 cpm 值的 EdgeR rpkm，它返回

“rpkm.default(x_cpm) 中的错误：缺少参数“gene.length”，没有默认值”

谢谢

r rna-seq

2020-06-04T20:42:22.817

0 投票

1 回答

50 浏览

r - Bioconductor 单细胞 RNA seq 错误，assayData() 函数不起作用，为什么？

我正在遵循论文“单细胞 RNA 测序的生物导体工作流程：标准化、降维、聚类和谱系推断”中的代码。但是我在预处理步骤中遇到了功能测定数据（）的错误。这是论文的链接：https ://www.bioconductor.org/help/course-materials/2017/BioC2017/Day2/Workshops/singleCell/doc/workshop.html#introduction

我通过以下代码：

该文件已成功下载并解压缩，但我遇到错误：AssayData(CufflinkseSet)$exprs = NULL 中的错误：找不到对象'CufflinkseSet'。任何人都可以帮助我吗？太感谢了。

r bioinformatics bioconductor rna-seq

2020-06-08T10:12:27.277

0 投票

1 回答

942 浏览

r - NormalizeData.default 在 R 中的集成 seurat 对象上运行 DoubletFinder 时出错

我正在尝试在由各种数据集集成产生的 seurat 对象上运行 DoubletFinder。

Seurat 对象有 2 个分析：RNA 和集成。

集成的 seurat 对象已被完全处理：

归一化和 FindVariableFeature 预集成
集成对象上的 ScaleData、RunPCA、FindNeighbors、FindClusters、RunUMAP。

DoubletFinder 的 paramSweep_v3() 函数给出以下输出：

为什么这表明我的 Seurat 对象中没有插槽？

r rna-seq seurat

2020-06-08T16:10:37.910

0 投票

1 回答

112 浏览

r - 使用 R 从 RNAseq 结果摘要文件中提取多个基因集的数据

我正在尝试从 RNAseq 结果摘要文件中提取几个基因集的数据：

示例基因列表：

我正在使用 Excel 首先突出显示重复的基因，对摘要文件进行排序，然后复制我需要的数据。这很耗时，而且 Excel 在排序时总是“冻结”，尤其是对于大基因列表。

我想知道 R 是否可以做得更好。如果 R 可以成为更好的解决方案，有人可以提供代码吗？

r subset rna-seq

2020-06-11T21:28:38.333

问题标签 [rna-seq]

Reference