问题标签 [rna-seq]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-cloud-platform - 如何在google云平台做RNA seq分析?
我想在谷歌云平台(GCP)的计算引擎实例中使用 RNA seq 数据分析。我是 GCP 的新手。有很多管道。但我想自己安装软件并进行分析。有追索权,但我迷路了。我需要知道如何在存储桶中打开、保存和检索数据,如何在 GCP 中使用 shell 来安装包等。我将使用 Fastq-dump 进行数据下载,使用 STAR 进行对齐。
如果有人可以列出教程供我阅读,我将不胜感激。谢谢!
snakemake - snakemake - 缺少规则 salam_quant 的输入文件:错误
我正在尝试在 conda/mamba 环境中通过 snakemake 使用鲑鱼处理大量 RNA-seq 数据。
运行 snakemake 时收到以下错误:
这是我的蛇文件:
我尝试更改r1
和r2
输入的文件路径。但是,我认为我缺少某些东西或拥有太多东西。
这是我的 ls,其中 fastq 文件夹包含所有 fastq.gz 文件,转录组位于 gencode.v38_salmon.1.5.0 文件夹中,而 quants 文件夹为空:
这是 fastq 文件夹:
r - 使用“monocle3”时有关 expression_data 的错误
我最近开始使用“monocle3”,非常感谢您提前提供的所有帮助!
我正在尝试为我的数据构建单细胞轨迹,但我遇到了以下错误,不知道如何绕过它:
错误:参数 expression_data 必须是矩阵 - 来自 Matrix 包的稀疏矩阵或密集矩阵
在此步骤之前,我已完成以下操作:
我真的很感谢大家的意见:)
干杯,
r - 在 R 中遇到 tximport 问题
我正在跟随 DIYTranscriptomics
我无法让 Tximport 在我自己的样本上运行。我运行下面的代码,并得到以下输出。
我不明白的是,当我在 tsv 文件中手动搜索从 Ensembl 转录组创建的 tibble 中的转录时,例如 ENSDLAT005example,我可以找到它,反之亦然。在 tsv 和 tibble 中,这两列都称为 target_id。我不知道从这里去哪里。它应该工作,但事实并非如此。所有这些东西都在过去两周内完成/安装,所以我确信我没有使用过时的包或其他东西。
rna-seq - 如何在批量 RNA seq 数据中选择高度可变的基因?
作为预处理步骤,我需要从包含100 个不同样本(列)的大约 60k 个基因的批量 RNA-seq 数据中选择前 1000 个高度可变的基因(行)。列值已经包含三次的平均值。该表包含 FPKM 中的标准化值(注意:我无权访问原始计数,也无法使用常见的 R 包,因为这些包将原始计数作为输入。) 在这种情况下,选择前 1000 个可变基因?
我尝试使用rowSums()函数过滤掉基因(以删除 rowsums 值较低的基因)并将其从 60k 基因缩小到 10K 基因,但我不确定这是否是选择高度可变基因的正确方法。任何输入表示赞赏。
macos - Bowtie2 错误:“不存在或不是 Bowtie 2 索引”
我对生物信息学和 RNA-seq 非常陌生,所以请放轻松。当我尝试执行分析时,我不断收到同样的错误。背景:我有一个名为 tutorial 的文件夹,该文件夹中还有 4 个其他文件夹(目前重要的是 trimmed_fastq、bt2Index 和 insert_size)。使用 bowtie2-build,我在 bt2Index 文件夹中创建了一个索引为 Zv9 的 bt2 文件。现在我想将修剪后的读数(在 trimmed_fastq 中)与基因组对齐。
这就是我所做的以及我得到的错误:
我试过用几种不同的方式写出来,但无法解决。有任何想法吗?任何帮助将非常感激。我是一个完整的初学者。
r - 从 log2(TPM+1) 数据执行差异表达分析
我是 RNA-seq 分析的新手,我想对 log2(TPM+1) 数据进行 DE 分析。我知道这并不理想,但这是我可以从以前的数据集中获得的输入数据。我正在考虑使用 Limma 趋势和 eBayes,而不是使用我的 log2(TPM+1)使用 logCPM(推荐)。这是一个好主意吗?我应该使用不同的方法吗?
提前致谢
bioinformatics - 用于 Nanopore cDNA-seq 比对的 Minimap2 参考:找不到命令,为什么?
我正在尝试使用 Minimap2 将 Oxford Nanopore cDNA 读数映射到参考。我正在从终端在 unix 环境中使用 macbook。我已经下载了我的 fastq 文件和我的参考基因组,我已经按照GitHub 上的教程下载了 Minimap2 ,代码如下:
curl -L https://github.com/lh3/minimap2/releases/download/v2.21/minimap2-2.21_x64-linux.tar.bz2 | tar -jxvf -
然后尝试使用以下命令运行 Minimap2:
minimap2 -ax splice ref.fa nanopore-cdna.fa > aln.sam
但输出是:-bash: minimap2: command not found
所以看起来 minimap2 没有安装,但我可以看到包含名为 minimap2 的 Unix 可执行文件的文件夹。我该如何安装它?我的生物信息学经验很少,所以如果这是非常基本的,我深表歉意......
谢谢!
bioinformatics - 为什么 minimap2 输出没有对齐数据的 sam 文件?
我正在尝试使用 minimap2 将一些 Nanopore PCR-cDNA 测序数据与参考转录组对齐,但输出的 SAM 文件不是我所期望的。
这是我正在使用的代码行,如 minimap2 README 说明中所述:
minimap2 -ax splice ref_data/Homo_sapiens.GRCh38.cdna.all.fa data/fastq_runid_x_0.fastq > aligned/barcode10_x.sam
这是它运行时的输出,以防它有用:
它运行良好并输出 sam 文件,但它只包含没有任何对齐数据的标题,例如:
@SQ SN:ENST00000631435.1 LN:12
@SQ SN:ENST00000415118.1 LN:8
@SQ SN:ENST00000448914.1 LN:13
@SQ SN:ENST00000434970.2 LN:9
我究竟做错了什么?这是否意味着根本没有对齐?Nanopore 输出了许多 fastq 文件,我只尝试了其中几个来测试代码是否有效,我只是不幸地测试了不对齐的测序文件吗?会不会是别的东西?
r - BiocParallel 错误:无法打开连接,我该如何解决?
我正在尝试使用包 bambu 来量化 bam 文件中的基因计数。我正在使用我大学的 HPC,所以我编写了一个 R 脚本和一个批处理提交文件来启动它。
当脚本运行 bambu 函数时,它会给出以下错误:
所以看起来 BiocParallel 不高兴并且无法打开某个连接,但我不知道如何解决这个问题?
这是我的 R 脚本:
如果您对为什么会发生这种情况有任何想法,那将非常有帮助!谢谢