问题标签 [rna-seq]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 提取仅出现在 List 1 和 List 2 中的基因列表
我有两个差异表达基因列表,一个来自敲除 A 与对照,另一个来自敲除 B 与对照细胞。然而,该列表显示在 KOA 中表达的基因与在 KOB 中表达的基因略有不同,因此我想创建一个最终列表,其中仅包含那些同时出现在 KOA 和 KOB 中但又不相互排斥的基因。两个基因列表具有相同的列名并包含在 .csv 文件中。
由于我完全迷失了,我将如何在 R 中解决这个问题。
谢谢,-Yaseen
multithreading - GNU 并行的最佳线程数
我想我有一个相当基本的问题。我刚刚发现了 GNU 并行包,我认为我的工作流程真的可以从中受益!我正在使用一个循环遍历我的读取文件并生成所需的输出。每次读取执行的命令如下所示:
STAR --runThreadN 8 --genomeDir star_index/ --readFilesIn R1.fq R2.fq
如您所见,我指定了 8 个线程,这是我的虚拟机拥有的线程数。
我现在的问题如下:如果我将 GNU 与这样的命令并行使用:
cat reads| parallel -j 3 STAR --runThreadN 8 --genomeDir star_index/ --readFilesIn {}_R1.fq {}_R2.fq
如果我并行执行 3 个作业,我的虚拟机能否处理我指定的线程数?
还是我需要 24 个线程(3*8 个线程)才能正确执行此命令?
如果这是一个基本问题,我很抱歉,我对这个领域很陌生,非常感谢任何帮助!
r - 为什么 makeCATdb 函数不起作用?
我正在尝试在 R 中进行 GO 术语富集分析。我遵循了本教程。当我走到这一步...
...我收到此错误:
makeCATdb 中的错误(myfile = “GOannotationsBiomark_mod.txt”,lib = “NULL”,:找不到函数“makeCATdb”
我尝试安装 systemPipeRdata 并得到了同样的错误。请问这个功能怎么安装?谢谢!
r - DESeq2 设计矩阵,包括 RIN 作为公式中的协变量
我一直在关注最后一个 DESeq2 管道来执行 RNAseq 分析。我的问题是实验样品的 rin 与对照样品相比非常低。我阅读了一篇论文,其中他们使用时间过程 RNA 降解进行 RNAseq 分析,并得出结论,将 RIN 值作为协变量包括在内可以减轻样本中低 rin 的一些影响。
我的问题是我应该如何在 DESeq2 对象中构造设计:
我找不到合适的资源来解释如何构建这些模型(我是该领域的新手......)并且我认识到我用这些东西撞到了墙上。我也很感激一些好的资源链接,以便能够理解哪个是正确的以及为什么。
太感谢了
r - 生成 fastQC 报告
我正在使用fastqcr
R 包生成用于 RNAseq 分析的 fastq 文件的多 qc 和单 qc 报告。虽然我的 mlti-qc 报告工作正常,但我在尝试从 fastqc 结果压缩文件生成单个 qc 报告时发现以下错误。
开关错误(状态,PASS = “#00AFBB”,WARN = “#E7B800”,FAIL = “#FC4E07”):EXPR 必须是长度为 1 的向量
我正在使用的代码是
第 6 步 - 构建最终报告
它创建一个 HTML 文件,其中包含一个或多个样品的 FastQC 报告。
有人可以帮我解决这个问题。
谢谢
r - 同时对多个数据集进行 Wilcoxon 测试
我有一个关于我是否可以在循环中对所有生成的表进行 Wilcoxon 测试的问题。
基本上,我想在每个数据集的 2 个变量之间进行配对 Wilcoxon 检验,并且每个数据集的 2 个变量位于相同的位置(如第 x 列和第 y 列)。(对于熟悉生物学的人来说,实际上这是一些重复元素的控制样本和处理样本之间的 RPKM 值)我希望我可以为每个数据集的 Wilcoxon 检验生成一个 p 值表。
我准备好使用以下代码生成所有表/数据集/数据框,我想我想对每个数据集进行 Wilcoxon 测试,所以我认为我需要继续循环,但我不知道该怎么做:
这是单个数据集的结构:所以基本上我想在变量“R009_initial_filter_rpkm”和“normal_filter_rpkm”之间进行 Wilcoxon 测试
如果我使用了不正确的术语,我很抱歉,因为我是 R 的新手,非常感谢你的帮助
r - RNA-seq - R - 如何将基因长度导入 RPKM calc 的数据集
因此,原则上标准化原始计数 RNAseq 文件非常简单......
但是我的原始计数文件不伴随基因长度。
我如何/从哪里可以导入基因长度并将其与集合 ID 匹配?我正在使用来自 cpm 值的 EdgeR rpkm,它返回
“rpkm.default(x_cpm) 中的错误:缺少参数“gene.length”,没有默认值”
谢谢
r - Bioconductor 单细胞 RNA seq 错误,assayData() 函数不起作用,为什么?
我正在遵循论文“单细胞 RNA 测序的生物导体工作流程:标准化、降维、聚类和谱系推断”中的代码。但是我在预处理步骤中遇到了功能测定数据()的错误。这是论文的链接:https ://www.bioconductor.org/help/course-materials/2017/BioC2017/Day2/Workshops/singleCell/doc/workshop.html#introduction
我通过以下代码:
该文件已成功下载并解压缩,但我遇到错误:AssayData(CufflinkseSet)$exprs = NULL 中的错误:找不到对象'CufflinkseSet'。任何人都可以帮助我吗?太感谢了。
r - NormalizeData.default 在 R 中的集成 seurat 对象上运行 DoubletFinder 时出错
我正在尝试在由各种数据集集成产生的 seurat 对象上运行 DoubletFinder。
Seurat 对象有 2 个分析:RNA 和集成。
集成的 seurat 对象已被完全处理:
归一化和 FindVariableFeature 预集成
集成对象上的 ScaleData、RunPCA、FindNeighbors、FindClusters、RunUMAP。
DoubletFinder 的 paramSweep_v3() 函数给出以下输出:
为什么这表明我的 Seurat 对象中没有插槽?