问题标签 [samtools]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
490 浏览

samtools - Samtools pysam 伴侣

我正在使用 pysam 对 .bam 文件进行圆顶数据挖掘。我想检查读取是否有映射的伴侣。命令

如果没有映射伴侣,则会引发错误,所以如果我这样做了

这也会引发错误。还有其他方法可以检查读取是否有映射的伴侣?

谢谢。

0 投票
3 回答
497 浏览

python - 如何缓存读取?

我正在使用 python/pysam 来分析测序数据。在其命令伙伴的教程(pysam - An interface for reading and writing SAM files)中,它说:

'这种方法对于高通量处理来说太慢了。如果需要与其伙伴一起处理读取,请从读取名称排序的文件中工作,或者更好的是缓存读取。

您将如何“缓存读取”?

0 投票
0 回答
145 浏览

r - 使用 DEXSeqDataSetFromHTSeq 时出错

目前我正在尝试了解DEXSeq包。我有一个设计 tsv 文件和 7 个包含计数的文件。现在想运行以下命令

最后一个命令给出和错误

此错误是什么意思以及如何解决?加载包DEXSeq时出现警告

0 投票
3 回答
18367 浏览

ubuntu - make 找不到 curses.h

我有一个名为 samtools(1.3 版)的程序,用于处理从 DNA 测序实验中获得的文件。

下载的程序包含在一个文件夹中。要设置程序,我在终端中输入该文件夹(在 ubuntu 计算机上)。我进入突击队“make”。

它运行打印它所做的事情,但以错误消息终止:

我最初的反应(搜索互联网后)是没有安装 curses,我尝试使用 sudo 来解决这个问题(但显然我的用户不在 sudoers 列表中。

所以我尝试查看是否已经安装了curses,在咨询了互联网后我尝试了

这给出了输出:

我把它当作安装了诅咒。但这让我不知所措。但这至少应该意味着诅咒存在吧?我对使用 ubuntu 或 C 程序不是很有经验(很久以前我在 C 中学习过一个较小的课程,虽然我使用过很多 linux 计算机,但我主要使用终端进行导航)

乐于助人!

0 投票
1 回答
571 浏览

samtools - 如何使用 pysam.view 模拟 samtools 视图的所有功能

我正在尝试使用 pysam.view() 从 BAM 文件中过滤掉某些对齐。我面临的问题是如何在过滤器中包含多个区域。

pysam.view() 模拟 samtools view 命令,该命令允许输入由空格字符分隔的多个区域,例如:

但是对应的 pysam.view 调用:

不起作用。它不返回任何对齐方式。我很确定问题在于如何指定区域列表,因为以下命令可以正常工作:

并返回对齐方式。

我的问题是: pysam.view 是否支持多个区域以及如何指定此列表?我已经搜索了有关此的文档,但没有找到任何东西。

0 投票
1 回答
40 浏览

loops - 处理 unix 循环中的路径

相对的unix新手。我有许多目录 ( Sample*/),我想在其中使用 samtools 合并所有 raw.sort.bam 文件。我在每个目录中都有工作代码来执行此操作,但我想通过从父目录运行代码来一次处理所有目录。我的问题是我被迫使用完整路径调用 samtools,并且我无法弄清楚该路径将如何在 unix 循环中工作。

首先,这是我在每个目录中合并和转换的工作代码:

现在,我的非工作代码在从父目录运行时尝试对所有目录执行此操作:

错误:

提前致谢。

0 投票
2 回答
320 浏览

regex - Mpileup regex 命令删除插入缺失

我正在尝试从 mpileup txt 文件中过滤掉插入和删除。插入或删除的一个例子是 +3ATG 或 -9AATCGTCTC。

在另一篇文章中,我找到了使用 perl 的解决方案:

引用来自表达式早期部分的匹配项的正则表达式

但是,该脚本将插入和删除写入特殊变量 $&。我想用新变量中的任何内容替换所有插入和删除。所以我的解决方案是相同的,但是在开始时替换并且什么都不替换,见下文。

$row =~ s/(\d+)(??{"."*$1})//xg;

有谁知道为什么它不起作用或替代解决方案?

我也很乐意匹配不是插入或删除的任何内容,并将其设为新变量。


这是输入的示例:

$,.................................,,..................,, ....,,G。,,,,,..,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ,.,......,,,,......,,,,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,......,,......,,,,,, ,,,,,......,,,,,,,,,,,,,,,,,,,,,,,,,,.,,.,,,...... ....................,,.,........,.,.,,....,... ........,,......................,,,,,,...... .............,,,,,,,,........,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, .,,,,,,,,,,,,,,,,,,,,.+12GATGCTGTGTTT..,,,,,,,,.,,,,,,,,,,,,,,,, ,,,,,,,,.,,.,,-8tgatgctg,,,...,,..,,,,,,,,,,,,,,,,,,,,,,,, ,,,,..

这是我想要的输出示例:

$,.................................,,..................,, ....,,G。,,,,,..,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ,.,......,,,,......,,,,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,......,,......,,,,,, ,,,,,......,,,,,,,,,,,,,,,,,,,,,,,,,,.,,.,,,...... ....................,,.,........,.,.,,....,... ........,,......................,,,,,,...... .............,,,,,,,,........,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, .,,,,,,,,,,,,,,,,,,,,.+..,,,,,,,,.,,,,,,,,,,,,,,,, ,,,,,,,.,,.,,-,,,...,,..,,,,,,,,,,,,,,,,,,,,,,,,,, ,,..

干杯,

丹尼尔

0 投票
1 回答
715 浏览

python - 使用 pysam 提供的类属性在 Spark 中过滤 RDD

我正在使用pysamPython 库来读取 Spark 中的 BAM 文件。我创建了一个包含“BAM”数据的 RDD。当我尝试使用类(pysam 库)filter的属性来处理数据时,火花会崩溃。运行和工作正常。我对 Spark 很陌生。query_sequenceAlignedSegmentdata.count()data.first()

这是我的代码:

我得到以下输出:

0 投票
0 回答
403 浏览

bioinformatics - 如何使用 htslib/samtools 转换 SAM/BAM 读取?

我正在使用该htslib库来读取 SAM/BAM 文件,它运行良好。我还可以将对齐写回新的 SAM/BAM 文件。

例如,以下代码打印比对的 DNA 序列:

问题:如何更改查询顺序?比如说,把第一个字母改成“T”?bam_get_seq返回一个读的序列,但是没有bam_set_seq函数?理想情况下,我正在寻找类似的东西:

如果我能弄清楚如何进行更新,我就知道如何将信息写入新的 SAM/BAM 文件。

0 投票
1 回答
248 浏览

bioinformatics - 如何使用 SAMtool htslib 库读取可选信息字段

我有一个 BAM 文件:

我需要阅读NM:i:0 AS:i:101 XS:i:0 RG:Z:group1我的 C++ 代码中的可选字段。我可以使用该htslib库来阅读除那些可选字段之外的所有内容。

htsib 库的源文件Github 上。不幸的是,我找不到可以读取这些字段的函数。

问:如何使用 htslib 读取可选字段?