问题标签 [rna-seq]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - DESeq2 代码有助于分析 R 中疾病和对照患者之间的差异基因表达
我在设计一些正确的代码来解决在 R 中使用 DESeq2 时遇到了麻烦,如何查看与对照相比,哪些基因在疾病患者中的表达更高。
我的数据目前是一个大型数据框,由 600000 个基因名称组成,这些基因名称是行。前三列 [1:3] 是对照患者,后三列来自胰腺癌患者 [4:6]。
得到低于0.05的基因个数;
然后我需要计算疾病与对照之间的倍数变化,包括上调和下调。我需要设置自己的倍数变化阈值,然后通过KEGG根据我的p值分析最上调或下调的基因的功能;
但是以上都不起作用,我想我可能使用 type=rep 出错了?我最终需要将 p 值和日志折叠更改值保存到表中。
r - Seurat DimPlot - 突出显示不同颜色的特定单元格组
对于这个可能非常基本的问题,我深表歉意,但我无法弄清楚:
我有一个带有 20 组不同单元格的 Seurat 对象(所有单元格都在元数据中定义并设置为active.ident)。其中 10 个是“已处理”,10 个是“未处理”(此信息也在元数据中)。
我正在尝试制作一次突出显示 1 组的 DimPlot,但“处理”和“未处理”的颜色应该不同。
我的工作代码以相同的颜色突出显示“处理过的”和“未处理过的”:
正确的方法是什么?
任何建议都非常感谢!
r - 为 R 中的读取计数矩阵生成行名称的问题
我正在按照本教程在线分析细胞类型之间的 RNA-seq 数据。
https://combine-australia.github.io/RNAseq-R/06-rnaseq-day1.html
我已经能够使用我自己的数据执行其中的大部分操作,但我现在正在尝试执行通路富集分析。但是,我遇到了问题,因为我无法将初始读取计数矩阵的行标记为基因 ID。
我试图简单地使用基因 ID 创建一个新列,但是这会将矩阵更改为数据框并阻止我使用 DGEList。
seqdata 是我的 data.frame,其中包含来自分析的基因的所有信息,第 1 列作为基因 ID 名称,第 15 到 24 列作为向量,其中包含 10 个样本中每个基因的读取计数信息。
我从这个 data.frame 生成了一个名为 readcounts_g 的矩阵,它只有每个基因的读取计数,但我试图分配行名,在其中我从 seqdata 中获取第 1 列并使用此向量中的基因名称来分配readcounts_g 数据帧的行名。
我也曾想过将基因名称作为附加向量简单地输入到 readcounts_g 中,但如果我这样做了,我就不能使用 DEGList,因为它需要一个矩阵。
最终,我尝试使用 goana 对差异表达的基因进行富集途径分析。但是,如果没有将基因名称分配给最终的 DEG 矩阵,我将无法做到这一点。
如果有人对我如何解决这个问题有见解,将不胜感激。如果需要,我可以尝试进一步解释。
r - 如果我对每个基因的原始信息是它们的 ENSEMBL ID,我如何使用 select(org.Mm.eg.db) 函数在 R 中注释我的基因?
我试图弄清楚如何使用以下方法注释我的一组基因,以便我可以对注释的差异表达基因进行通路分析
这是我遇到问题的代码行:
我正在尝试为最终对象中的每个基因生成 entrez ID、符号和基因名称。
基本上 - 我从一个原始矩阵“readcounts_g”开始,它有 10 个 RNA-seq 读取计数数据样本,用于 20k 个基因和对应于 ENSEMBL ID 的行名。
接下来,我执行了以下代码行:
为我们的实验条件生成一个设计矩阵,指定前 5 个样本为 KO,后 5 个样本为 WT。
最终,我希望能够使用:
- 我想要这个,以便我可以吐出一张表,其中包含顶级差异表达基因及其基因名称等。
- 我还希望能够用基因名称而不是我目前拥有的 ID 号绘制火山图和其他图形
另一个问题是当我执行该goana
函数时,它是否能够正确识别我的数据集中的哪些基因,尽管只有 ENSEMBL ID 号而不是 ENTREZ ID 号
这是我正在使用的集合的示例:
从这里开始,data_1 本质上是一个截断版本的矩阵,我正在使用它来处理我的真实数据。
我正在尝试用 Entrez 基因 ID 注释这个矩阵,这样我就可以在 limma 中使用 goana 函数。
我认为下面这行会起作用,我将“键类型”指定为集合 ID #s,它返回 entrez ID:
ann <- select(org.Mm.eg.db,keys = rownames(fit.cont2),keytypes="ENSEMBL", columns=c("ENTREZID"))
r - 尝试在 R 中安装快速 qc
我正在尝试在 R 中安装 fastqc 以构建 RNA-Seq 分析管道,我已经尝试了所有方法,当我尝试使用“install.packages(“fastqc”)”安装它时,我收到以下错误消息:
“install.packages 中的警告:package 'fastqc' 不可用(对于 R 版本 3.5.0)”
任何帮助表示赞赏,在此先感谢。
r - 使用 ViSEAGO create_topGO 加载自己的数据时出错
我无法使用自己的数据创建 topGO 对象。想知道是否有人可以帮助我!
我正在遵循原始 ViSEAGO 论文中提到的几个教程和步骤。以下是教程中的部分内容及其链接。
来自出版物:ViSEAGO 提供在 Bioconductor topGO R 包中开发的所有统计测试和算法,通过使用 ViSEAGO::create_topGO- 数据方法和 topGO::runTest 方法来考虑 GO 图的拓扑。
在教程中的“功能性 GO 丰富”下,使用以下代码生成 topGO 对象。
我还参考了 topGO 的教程以确保我的数据类型正确。然而,有一些错误,我很难处理。
对于我的数据,我有以下代码。
在我的例子中,geneList_g1 是一个带有基因符号和 p 值的命名 num(长度为 23 个差异表达的基因,如下所示)。正在研究的有机体是Mus musculus。
使用另一个命令创建 topGO 对象,我收到以下错误。
任何帮助深表感谢!!提前致谢!:)
r - ViSEAGO 教程:可视化 topGO 对象
早些时候,我发布了一个问题,并且在一些帮助后能够成功加载我的数据并创建一个 topGO 对象。我正在尝试可视化与我从小鼠 RNA-seq 数据中获得的差异表达基因列表显着相关的 GO 术语。
现在,我想提出对ViSEAGO 教程的关注。本教程最初指定加载两个文件:“selection.txt”和“background.txt”。这些文件的来源没有明确说明。然而,在深入研究了 topGO 的文档之后,我能够找到每个文件的数据类型。但是,即使在遵循这些之后,我在运行以下代码时也遇到了问题。有没有人有任何见解可以分享?
工作代码:
问题:
根据教程,打印的表格包含每个丰富的 GO 术语、附加列,包括通过比较评估的重要基因列表和频率(重要基因数量与背景基因数量的比率)。我想我有,但它肯定是行不通的。
有人能看出为什么吗?这一点我不是很清楚。谢谢!
wildcard - Snakemake 通配符语法错误
我知道这是一个常见错误,我已经检查了其他帖子,但它并没有解决我的问题。我想使用与我使用相同的方式用于SortMeRNA
rule( ) 的数据库的名称。但很显然,我做不到。rRNAdb=config["rRNA_database"]
version=config["genome_version"]
是因为我在规则中使用它params
而不是在这条规则中吗?因为在规则中,在规则中使用它似乎不是问题,而不是在......output
SortMeRNA
inputs
version
Bowtie
outputs
input
download - 无法使用 Aspera 下载数据
我正在尝试使用Aspera CLI 从欧洲核苷酸档案 (ENA)下载数据,但是我的下载已停止。我之前使用相同的工具下载了几个文件,但这是自上个月以来发生的。我通常使用以下命令:
从Beta Science上的一篇文章中,我了解到这可能是由于没有限制下载速度,因此尝试使用该-l
参数,但没有任何帮助。
rna-seq - 尝试将参考基因组与 STAR 对齐
我正在尝试在 STAR 2.7.3a 上设置参考基因组,以便将 RNA-Seq 中的读数映射到它。
这是我使用的代码:
由于致命输入而退出
错误:无法打开 readFilesIn=Read1
Jan 24 15:44:39 ...... 致命错误,退出
有谁知道 readFilesIn=Read1 是什么意思?
谢谢