问题标签 [rna-seq]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
214 浏览

r - DESeq2 代码有助于分析 R 中疾病和对照患者之间的差异基因表达

我在设计一些正确的代码来解决在 R 中使用 DESeq2 时遇到了麻烦,如何查看与对照相比,哪些基因在疾病患者中的表达更高。

我的数据目前是一个大型数据框,由 600000 个基因名称组成,这些基因名称是行。前三列 [1:3] 是对照患者,后三列来自胰腺癌患者 [4:6]。

得到低于0.05的基因个数;

然后我需要计算疾病与对照之间的倍数变化,包括上调和下调。我需要设置自己的倍数变化阈值,然后通过KEGG根据我的p值分析最上调或下调的基因的功能;

但是以上都不起作用,我想我可能使用 type=rep 出错了?我最终需要将 p 值和日志折叠更改值保存到表中。

0 投票
1 回答
3365 浏览

r - Seurat DimPlot - 突出显示不同颜色的特定单元格组

对于这个可能非常基本的问题,我深表歉意,但我无法弄清楚:

我有一个带有 20 组不同单元格的 Seurat 对象(所有单元格都在元数据中定义并设置为active.ident)。其中 10 个是“已处理”,10 个是“未处理”(此信息也在元数据中)。

R 修拉包

我正在尝试制作一次突出显示 1 组的 DimPlot,但“处理”和“未处理”的颜色应该不同。

我的工作代码以相同的颜色突出显示“处理过的”和“未处理过的”:

正确的方法是什么?

任何建议都非常感谢!

0 投票
1 回答
303 浏览

r - 为 R 中的读取计数矩阵生成行名称的问题

我正在按照本教程在线分析细胞类型之间的 RNA-seq 数据。

https://combine-australia.github.io/RNAseq-R/06-rnaseq-day1.html

我已经能够使用我自己的数据执行其中的大部分操作,但我现在正在尝试执行通路富集分析。但是,我遇到了问题,因为我无法将初始读取计数矩阵的行标记为基因 ID。

我试图简单地使用基因 ID 创建一个新列,但是这会将矩阵更改为数据框并阻止我使用 DGEList。

seqdata 是我的 data.frame,其中包含来自分析的基因的所有信息,第 1 列作为基因 ID 名称,第 15 到 24 列作为向量,其中包含 10 个样本中每个基因的读取计数信息。

我从这个 data.frame 生成了一个名为 readcounts_g 的矩阵,它只有每个基因的读取计数,但我试图分配行名,在其中我从 seqdata 中获取第 1 列并使用此向量中的基因名称来分配readcounts_g 数据帧的行名。

我也曾想过将基因名称作为附加向量简单地输入到 readcounts_g 中,但如果我这样做了,我就不能使用 DEGList,因为它需要一个矩阵。

最终,我尝试使用 goana 对差异表达的基因进行富集途径分析。但是,如果没有将基因名称分配给最终的 DEG 矩阵,我将无法做到这一点。

如果有人对我如何解决这个问题有见解,将不胜感激。如果需要,我可以尝试进一步解释。

0 投票
0 回答
232 浏览

r - 如果我对每个基因的原始信息是它们的 ENSEMBL ID,我如何使用 select(org.Mm.eg.db) 函数在 R 中注释我的基因?

我试图弄清楚如何使用以下方法注释我的一组基因,以便我可以对注释的差异表达基因进行通路分析

这是我遇到问题的代码行:

我正在尝试为最终对象中的每个基因生成 entrez ID、符号和基因名称。

基本上 - 我从一个原始矩阵“readcounts_g”开始,它有 10 个 RNA-seq 读取计数数据样本,用于 20k 个基因和对应于 ENSEMBL ID 的行名。

接下来,我执行了以下代码行:

为我们的实验条件生成一个设计矩阵,指定前 5 个样本为 KO,后 5 个样本为 WT。

最终,我希望能够使用:

  1. 我想要这个,以便我可以吐出一张表,其中包含顶级差异表达基因及其基因名称等。
  2. 我还希望能够用基因名称而不是我目前拥有的 ID 号绘制火山图和其他图形

另一个问题是当我执行该goana函数时,它是否能够正确识别我的数据集中的哪些基因,尽管只有 ENSEMBL ID 号而不是 ENTREZ ID 号

这是我正在使用的集合的示例:

从这里开始,data_1 本质上是一个截断版本的矩阵,我正在使用它来处理我的真实数据。

我正在尝试用 Entrez 基因 ID 注释这个矩阵,这样我就可以在 limma 中使用 goana 函数。

我认为下面这行会起作用,我将“键类型”指定为集合 ID #s,它返回 entrez ID:

ann <- select(org.Mm.eg.db,keys = rownames(fit.cont2),keytypes="ENSEMBL", columns=c("ENTREZID"))

0 投票
0 回答
142 浏览

r - 尝试在 R 中安装快速 qc

我正在尝试在 R 中安装 fastqc 以构建 RNA-Seq 分析管道,我已经尝试了所有方法,当我尝试使用“install.packages(“fastqc”)”安装它时,我收到以下错误消息:

“install.packages 中的警告:package 'fastqc' 不可用(对于 R 版本 3.5.0)”

任何帮助表示赞赏,在此先感谢。

0 投票
1 回答
636 浏览

r - 使用 ViSEAGO create_topGO 加载自己的数据时出错

我无法使用自己的数据创建 topGO 对象。想知道是否有人可以帮助我!

我正在遵循原始 ViSEAGO 论文中提到的几个教程和步骤。以下是教程中的部分内容及其链接。

来自出版物:ViSEAGO 提供在 Bioconductor topGO R 包中开发的所有统计测试和算法,通过使用 ViSEAGO::create_topGO- 数据方法和 topGO::runTest 方法来考虑 GO 图的拓扑。

在教程中的“功能性 GO 丰富”下,使用以下代码生成 topGO 对象。

我还参考了 topGO 的教程以确保我的数据类型正确。然而,有一些错误,我很难处理。

对于我的数据,我有以下代码。

在我的例子中,geneList_g1 是一个带有基因符号和 p 值的命名 num(长度为 23 个差异表达的基因,如下所示)。正在研究的有机体是Mus musculus。

使用另一个命令创建 topGO 对象,我收到以下错误。

任何帮助深表感谢!!提前致谢!:)

0 投票
2 回答
1104 浏览

r - ViSEAGO 教程:可视化 topGO 对象

早些时候,我发布了一个问题,并且在一些帮助后能够成功加载我的数据并创建一个 topGO 对象。我正在尝试可视化与我从小鼠 RNA-seq 数据中获得的差异表达基因列表显着相关的 GO 术语。

现在,我想提出对ViSEAGO 教程的关注。本教程最初指定加载两个文件:“selection.txt”和“background.txt”。这些文件的来源没有明确说明。然而,在深入研究了 topGO 的文档之后,我能够找到每个文件的数据类型。但是,即使在遵循这些之后,我在运行以下代码时也遇到了问题。有没有人有任何见解可以分享?

工作代码:

问题:

根据教程,打印的表格包含每个丰富的 GO 术语、附加列,包括通过比较评估的重要基因列表和频率(重要基因数量与背景基因数量的比率)。我想我有,但它肯定是行不通的。

有人能看出为什么吗?这一点我不是很清楚。谢谢!

0 投票
1 回答
885 浏览

wildcard - Snakemake 通配符语法错误

我知道这是一个常见错误,我已经检查了其他帖子,但它并没有解决我的问题。我想使用与我使用相同的方式用于SortMeRNArule( ) 的数据库的名称。但很显然,我做不到。rRNAdb=config["rRNA_database"]version=config["genome_version"]

是因为我在规则中使用它params而不是在这条规则中吗?因为在规则中,在规则中使用它似乎不是问题,而不是在......outputSortMeRNAinputsversionBowtieoutputsinput

0 投票
1 回答
307 浏览

download - 无法使用 Aspera 下载数据

我正在尝试使用Aspera CLI 从欧洲核苷酸档案 (ENA)下载数据,但是我的下载已停止。我之前使用相同的工具下载了几个文件,但这是自上个月以来发生的。我通常使用以下命令:

Beta Science上的一篇文章中,我了解到这可能是由于没有限制下载速度,因此尝试使用该-l参数,但没有任何帮助。

在此处输入图像描述

0 投票
0 回答
90 浏览

rna-seq - 尝试将参考基因组与 STAR 对齐

我正在尝试在 STAR 2.7.3a 上设置参考基因组,以便将 RNA-Seq 中的读数映射到它。

这是我使用的代码:

由于致命输入而退出

错误:无法打开 readFilesIn=Read1

Jan 24 15:44:39 ...... 致命错误,退出

有谁知道 readFilesIn=Read1 是什么意思?

谢谢