问题标签 [rna-seq]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
269 浏览

r - 在 DESeq2 PCA 上为不同的 geom_point 形状添加黑色轮廓

我正在使用 DESeq2 包运行 PCA,并希望在已经基于观察的形状上获得黑色轮廓。圆形的工作,但其他形状没有。

例如Make stat_ellipse {ggplot2} outline geom_point fill colorPlace aborder around points将数据绘制为一个唯一的形状。

很难给出一个可重现的例子,因为它以前在一个大数据集上执行过 PCA,但这是我运行的以下内容:

我相信关键在于新层的编码geom_point

在此处输入图像描述

跑步scale_fill_manual I get the following

在此处输入图像描述

0 投票
1 回答
33 浏览

r - 如何在 pheatmap 中按行绘制值?

我注意到在使用 pheatmap 时,它会在观察和样本中从最高到最低的总体丰度进行绘制,但是我会对每行(每次观察)的模式感兴趣。

如何绘制每行而不是整体的丰度?(即:每一行的红色值最高,蓝色最低,而不是观测值 A 的分辨率最高,而观测值 X 的蓝色值最高)?

在此处输入图像描述

0 投票
1 回答
254 浏览

r - 从 pheatmap 中的 cutree_rows 组中提取基因/观察值

您如何从cutree_rows = 3in生成的行组中提取基因/观察值pheatmap?会是obj$tree_row$...

obj$kmeans$cluster我已经看到,如果您通过运行这样的方式应用 k 均值,您可以找到基因列表,有没有办法在热图中保留聚类但减少观察次数?

0 投票
1 回答
247 浏览

r - 为什么我的 R 函数没有运行?尝试将 R 脚本发送到集群

这是一个非常初学者的问题,所以提前感谢。

我得到了一个 R 脚本,用于将 fastq 文件与基因组对齐。我需要做的就是将此 R 脚本发送到我的 uni 集群,但我想确保脚本在我自己的计算机上运行良好,然后再将其发送到 void。我试图了解为什么我的函数无法运行。它首先加载一个库,然后将其余操作包含在一个函数中。当我 cmd+enter 函数时,它只在控制台中返回蓝色文本,但实际上并没有运行任何东西。因此,我假设如果发送到集群它也不会做任何事情。但为什么?

例如,如果我想运行名为“buildindex”的第一部分,我需要手动激活它。但是,如果仅通过函数调用它,则不会发生任何事情。请帮助我了解我需要解决的问题。这段代码是由一位忙于帮助我解决这些问题的博士后给我的。

这是我在 cmd+输入“analyzeRNAseq”函数时在控制台上看到的。每行的+是什么意思??

在我看来,一旦我进入这个功能,它应该开始在我的笔记本电脑上运行,但事实并非如此。请帮忙。

0 投票
1 回答
102 浏览

r - 我在 R 中的 Deseq2 包中工作并尝试使用 write.csv(dataframe, file="file.csv") 导出数据,但无法获取文件中的数据

使用此代码,我创建了一个向量 resSig

我打印前 500 个基因

现在,我正在尝试将此数据导出到 csv 文件

0 投票
0 回答
104 浏览

rna-seq - MarkDuplicates Picard

我正在使用 Picard 仅标记我阅读了 MarkDuplicates 手册的光学副本。我的脚本看起来像这样

当我使用 samtool 标志 0x400 时,我不确定我是否只得到光学副本,此时的任何建议都非常感谢。

0 投票
0 回答
127 浏览

r - 确定火山图上过滤了哪些 RNA SEQ 数据

我正在使用 RNA seq 数据通过 R 中的火山图(比较使用和不使用抗生素的细菌的差异基因表达)分析基因。创建我的图后,我不确定为什么我的一些值在一个条件和另一个条件中非“0”的 TPM 值未确定为差异表达。我的火山图上的一些基因在 TPM 上有这种差异,并且在我的图上显示为显着,而根据我的图,其他具有“0”值差异的基因被认为不显着。

这是我的数据样本(UO1_D712_##### 代表基因座编号,顶列代表不同的重复,其中“1”未处理,“2”用抗生素处理,数字旁边的字母代表不同技术复制):

设计矩阵:

我通读了这个 edgeR 用户手册来编写我的代码:http ://bioconductor.org/packages/release/bioc/vignettes/edgeR/inst/doc/edgeRUsersGuide.pdf

这是我编写代码以对 RNA seq 数据进行采样的方式(注意 ~/Documents/VOLCANO/R10LB_0ugvs0.5ug.csv 指的是上面的数据样本,~/Documents/VOLCANO/R10LB_0vs0.5_designmatrix.csv 指的是上面的设计矩阵):

这是我将数据格式化为火山图的代码:

这是我目前拥有的所有数据的火山图: 火山图

你能解释一下其中一些函数是如何过滤我的数据的(即 filterByExpr、estimateDisp、makeContrasts、glmFit、glmLRT)吗?为什么我的一些数据点从一种条件下的 0 TPM 变为另一种条件下的某个值,而其他数据点却没有?

您是否会推荐其他特定的过滤过程来更改、修复和/或改进我的火山图?

0 投票
2 回答
58 浏览

r - for-loop 线性回归生成带有结果的新数据框

我想在 R 上编写一个循环来对我的数据集基因(= 210011 个基因和总共 6 个样本;列是基因,行是样本)执行线性回归,以确定年龄和性别如何影响基因表达。我想将线性回归的拟合值输出保存在一个新的数据框中(基本上生成一个类似的数据框,其中列上有基因,行中有样本)。

所以我写的循环是:

但我无法保存新的数据框。我试图按照这个如何在 R 中循环/重复线性回归

但它给了我“0列表”作为结果,所以我一定写错了。如何修改我的原始代码生成一个新的数据框的结果?

感谢您的帮助!

0 投票
0 回答
15 浏览

genome - 如何显示 CTCF 结合位点重叠的统计显着性

我已经对 lncRNA 进行了 RNA-Seq。在 Ensembl 基因组浏览器中查看时,我有 8 个差异表达的 lncRNA,并且所有 8 个重叠的 CTCF 结合位点。我如何证明这在统计上是显着的,而不是偶然发生的?我读过他们做过类似事情的论文,但他们从未说明他们是如何做到的。也有人可以告诉我我在哪里可以确切地找到有多少 CTCF 绑定站点?(对于人类)。我无法从 Ensembl 找到此信息。非常感谢。

0 投票
1 回答
39 浏览

python - scRNA-seq:如何使用预先计算的 PCA 分数/负载来使用 TSNE python 实现?

来自此资源的 Python t-sne 实现:https ://lvdmaaten.github.io/tsne/

顺便说一句,我是 scRNA-seq 的初学者。

我正在尝试做的事情:使用 scRNA-seq 数据集并在其上运行 t-SNE,但使用先前计算的 PCA(我有 PCA.score 和 PCA.load 文件)

Q1:我应该可以在 tSNE 中使用我选择的计算 PCA,但是在运行 Y = tsne.tsne(X) 时我应该使用哪个文件 pca.score 或 pca.load?

Q2:我尝试删除/替换部分 PCA 计算代码以尝试删除 PCA 预处理,但它似乎总是出错。我应该改变什么才能正确使用我已经有的 PCA 数据而不是再次从中计算 PCA?

PCA 处理代码的原始形式如下: