0 投票

1 回答

214 浏览

r - DESeq2 代码有助于分析 R 中疾病和对照患者之间的差异基因表达

我在设计一些正确的代码来解决在 R 中使用 DESeq2 时遇到了麻烦，如何查看与对照相比，哪些基因在疾病患者中的表达更高。

我的数据目前是一个大型数据框，由 600000 个基因名称组成，这些基因名称是行。前三列 [1:3] 是对照患者，后三列来自胰腺癌患者 [4:6]。

得到低于0.05的基因个数；

然后我需要计算疾病与对照之间的倍数变化，包括上调和下调。我需要设置自己的倍数变化阈值，然后通过KEGG根据我的p值分析最上调或下调的基因的功能；

但是以上都不起作用，我想我可能使用 type=rep 出错了？我最终需要将 p 值和日志折叠更改值保存到表中。

r bioinformatics bioconductor rna-seq

2019-11-13T19:04:54.613

0 投票

1 回答

3365 浏览

r - Seurat DimPlot - 突出显示不同颜色的特定单元格组

对于这个可能非常基本的问题，我深表歉意，但我无法弄清楚：

我有一个带有 20 组不同单元格的 Seurat 对象（所有单元格都在元数据中定义并设置为active.ident）。其中 10 个是“已处理”，10 个是“未处理”（此信息也在元数据中）。

R 修拉包

我正在尝试制作一次突出显示 1 组的 DimPlot，但“处理”和“未处理”的颜色应该不同。

我的工作代码以相同的颜色突出显示“处理过的”和“未处理过的”：

正确的方法是什么？

任何建议都非常感谢！

r bioinformatics rna-seq seurat

2019-11-29T09:07:02.283

0 投票

1 回答

303 浏览

r - 为 R 中的读取计数矩阵生成行名称的问题

我正在按照本教程在线分析细胞类型之间的 RNA-seq 数据。

https://combine-australia.github.io/RNAseq-R/06-rnaseq-day1.html

我已经能够使用我自己的数据执行其中的大部分操作，但我现在正在尝试执行通路富集分析。但是，我遇到了问题，因为我无法将初始读取计数矩阵的行标记为基因 ID。

我试图简单地使用基因 ID 创建一个新列，但是这会将矩阵更改为数据框并阻止我使用 DGEList。

seqdata 是我的 data.frame，其中包含来自分析的基因的所有信息，第 1 列作为基因 ID 名称，第 15 到 24 列作为向量，其中包含 10 个样本中每个基因的读取计数信息。

我从这个 data.frame 生成了一个名为 readcounts_g 的矩阵，它只有每个基因的读取计数，但我试图分配行名，在其中我从 seqdata 中获取第 1 列并使用此向量中的基因名称来分配readcounts_g 数据帧的行名。

我也曾想过将基因名称作为附加向量简单地输入到 readcounts_g 中，但如果我这样做了，我就不能使用 DEGList，因为它需要一个矩阵。

最终，我尝试使用 goana 对差异表达的基因进行富集途径分析。但是，如果没有将基因名称分配给最终的 DEG 矩阵，我将无法做到这一点。

如果有人对我如何解决这个问题有见解，将不胜感激。如果需要，我可以尝试进一步解释。

r edge-list rna-seq

2020-01-02T20:55:20.040

0 投票

0 回答

232 浏览

r - 如果我对每个基因的原始信息是它们的 ENSEMBL ID，我如何使用 select(org.Mm.eg.db) 函数在 R 中注释我的基因？

我试图弄清楚如何使用以下方法注释我的一组基因，以便我可以对注释的差异表达基因进行通路分析

这是我遇到问题的代码行：

我正在尝试为最终对象中的每个基因生成 entrez ID、符号和基因名称。

基本上 - 我从一个原始矩阵“readcounts_g”开始，它有 10 个 RNA-seq 读取计数数据样本，用于 20k 个基因和对应于 ENSEMBL ID 的行名。

接下来，我执行了以下代码行：

为我们的实验条件生成一个设计矩阵，指定前 5 个样本为 KO，后 5 个样本为 WT。

最终，我希望能够使用：

我想要这个，以便我可以吐出一张表，其中包含顶级差异表达基因及其基因名称等。
我还希望能够用基因名称而不是我目前拥有的 ID 号绘制火山图和其他图形

另一个问题是当我执行该goana函数时，它是否能够正确识别我的数据集中的哪些基因，尽管只有 ENSEMBL ID 号而不是 ENTREZ ID 号

这是我正在使用的集合的示例：

从这里开始，data_1 本质上是一个截断版本的矩阵，我正在使用它来处理我的真实数据。

我正在尝试用 Entrez 基因 ID 注释这个矩阵，这样我就可以在 limma 中使用 goana 函数。

我认为下面这行会起作用，我将“键类型”指定为集合 ID #s，它返回 entrez ID：

ann <- select(org.Mm.eg.db,keys = rownames(fit.cont2),keytypes="ENSEMBL", columns=c("ENTREZID"))

r rna-seq

2020-01-03T20:25:23.170

0 投票

0 回答

142 浏览

r - 尝试在 R 中安装快速 qc

我正在尝试在 R 中安装 fastqc 以构建 RNA-Seq 分析管道，我已经尝试了所有方法，当我尝试使用“install.packages(“fastqc”)”安装它时，我收到以下错误消息：

“install.packages 中的警告：package 'fastqc' 不可用（对于 R 版本 3.5.0）”

任何帮助表示赞赏，在此先感谢。

r windows rna-seq

2020-01-07T17:50:15.433

0 投票

1 回答

636 浏览

r - 使用 ViSEAGO create_topGO 加载自己的数据时出错

我无法使用自己的数据创建 topGO 对象。想知道是否有人可以帮助我！

我正在遵循原始 ViSEAGO 论文中提到的几个教程和步骤。以下是教程中的部分内容及其链接。

来自出版物：ViSEAGO 提供在 Bioconductor topGO R 包中开发的所有统计测试和算法，通过使用 ViSEAGO::create_topGO- 数据方法和 topGO::runTest 方法来考虑 GO 图的拓扑。

在教程中的“功能性 GO 丰富”下，使用以下代码生成 topGO 对象。

我还参考了 topGO 的教程以确保我的数据类型正确。然而，有一些错误，我很难处理。

对于我的数据，我有以下代码。

在我的例子中，geneList_g1 是一个带有基因符号和 p 值的命名 num（长度为 23 个差异表达的基因，如下所示）。正在研究的有机体是Mus musculus。

使用另一个命令创建 topGO 对象，我收到以下错误。

任何帮助深表感谢！！提前致谢！:)

r rna-seq

2020-01-08T04:44:00.933

0 投票

2 回答

1104 浏览

r - ViSEAGO 教程：可视化 topGO 对象

早些时候，我发布了一个问题，并且在一些帮助后能够成功加载我的数据并创建一个 topGO 对象。我正在尝试可视化与我从小鼠 RNA-seq 数据中获得的差异表达基因列表显着相关的 GO 术语。

现在，我想提出对ViSEAGO 教程的关注。本教程最初指定加载两个文件：“selection.txt”和“background.txt”。这些文件的来源没有明确说明。然而，在深入研究了 topGO 的文档之后，我能够找到每个文件的数据类型。但是，即使在遵循这些之后，我在运行以下代码时也遇到了问题。有没有人有任何见解可以分享？

工作代码：

问题：

根据教程，打印的表格包含每个丰富的 GO 术语、附加列，包括通过比较评估的重要基因列表和频率（重要基因数量与背景基因数量的比率）。我想我有，但它肯定是行不通的。

有人能看出为什么吗？这一点我不是很清楚。谢谢！

r data-visualization ontology rna-seq

2020-01-08T20:42:37.427

0 投票

1 回答

885 浏览

wildcard - Snakemake 通配符语法错误

我知道这是一个常见错误，我已经检查了其他帖子，但它并没有解决我的问题。我想使用与我使用相同的方式用于SortMeRNArule( ) 的数据库的名称。但很显然，我做不到。rRNAdb=config["rRNA_database"]version=config["genome_version"]

是因为我在规则中使用它params而不是在这条规则中吗？因为在规则中，在规则中使用它似乎不是问题，而不是在......outputSortMeRNAinputsversionBowtieoutputsinput

wildcard snakemake rna-seq

2020-01-20T13:11:53.947

0 投票

1 回答

307 浏览

download - 无法使用 Aspera 下载数据

我正在尝试使用Aspera CLI 从欧洲核苷酸档案 (ENA)下载数据，但是我的下载已停止。我之前使用相同的工具下载了几个文件，但这是自上个月以来发生的。我通常使用以下命令：

从Beta Science上的一篇文章中，我了解到这可能是由于没有限制下载速度，因此尝试使用该-l参数，但没有任何帮助。

download ftp fastq ncbi rna-seq

2020-01-21T04:40:38.577

0 投票

0 回答

90 浏览

rna-seq - 尝试将参考基因组与 STAR 对齐

我正在尝试在 STAR 2.7.3a 上设置参考基因组，以便将 RNA-Seq 中的读数映射到它。

这是我使用的代码：

由于致命输入而退出

错误：无法打开 readFilesIn=Read1

Jan 24 15:44:39 ...... 致命错误，退出

有谁知道 readFilesIn=Read1 是什么意思？

谢谢

rna-seq

2020-01-25T00:00:37.310

问题标签 [rna-seq]

为我们的实验条件生成一个设计矩阵，指定前 5 个样本为 KO，后 5 个样本为 WT。

Reference