问题标签 [samtools]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
samtools - Samtools pysam 伴侣
我正在使用 pysam 对 .bam 文件进行圆顶数据挖掘。我想检查读取是否有映射的伴侣。命令
如果没有映射伴侣,则会引发错误,所以如果我这样做了
这也会引发错误。还有其他方法可以检查读取是否有映射的伴侣?
谢谢。
python - 如何缓存读取?
我正在使用 python/pysam 来分析测序数据。在其命令伙伴的教程(pysam - An interface for reading and writing SAM files)中,它说:
'这种方法对于高通量处理来说太慢了。如果需要与其伙伴一起处理读取,请从读取名称排序的文件中工作,或者更好的是缓存读取。
您将如何“缓存读取”?
r - 使用 DEXSeqDataSetFromHTSeq 时出错
目前我正在尝试了解DEXSeq
包。我有一个设计 tsv 文件和 7 个包含计数的文件。现在想运行以下命令
最后一个命令给出和错误
此错误是什么意思以及如何解决?加载包DEXSeq
时出现警告
ubuntu - make 找不到 curses.h
我有一个名为 samtools(1.3 版)的程序,用于处理从 DNA 测序实验中获得的文件。
下载的程序包含在一个文件夹中。要设置程序,我在终端中输入该文件夹(在 ubuntu 计算机上)。我进入突击队“make”。
它运行打印它所做的事情,但以错误消息终止:
我最初的反应(搜索互联网后)是没有安装 curses,我尝试使用 sudo 来解决这个问题(但显然我的用户不在 sudoers 列表中。
所以我尝试查看是否已经安装了curses,在咨询了互联网后我尝试了
这给出了输出:
我把它当作安装了诅咒。但这让我不知所措。但这至少应该意味着诅咒存在吧?我对使用 ubuntu 或 C 程序不是很有经验(很久以前我在 C 中学习过一个较小的课程,虽然我使用过很多 linux 计算机,但我主要使用终端进行导航)
乐于助人!
samtools - 如何使用 pysam.view 模拟 samtools 视图的所有功能
我正在尝试使用 pysam.view() 从 BAM 文件中过滤掉某些对齐。我面临的问题是如何在过滤器中包含多个区域。
pysam.view() 模拟 samtools view 命令,该命令允许输入由空格字符分隔的多个区域,例如:
但是对应的 pysam.view 调用:
不起作用。它不返回任何对齐方式。我很确定问题在于如何指定区域列表,因为以下命令可以正常工作:
并返回对齐方式。
我的问题是: pysam.view 是否支持多个区域以及如何指定此列表?我已经搜索了有关此的文档,但没有找到任何东西。
loops - 处理 unix 循环中的路径
相对的unix新手。我有许多目录 ( Sample*/
),我想在其中使用 samtools 合并所有 raw.sort.bam 文件。我在每个目录中都有工作代码来执行此操作,但我想通过从父目录运行代码来一次处理所有目录。我的问题是我被迫使用完整路径调用 samtools,并且我无法弄清楚该路径将如何在 unix 循环中工作。
首先,这是我在每个目录中合并和转换的工作代码:
现在,我的非工作代码在从父目录运行时尝试对所有目录执行此操作:
错误:
提前致谢。
regex - Mpileup regex 命令删除插入缺失
我正在尝试从 mpileup txt 文件中过滤掉插入和删除。插入或删除的一个例子是 +3ATG 或 -9AATCGTCTC。
在另一篇文章中,我找到了使用 perl 的解决方案:
但是,该脚本将插入和删除写入特殊变量 $&。我想用新变量中的任何内容替换所有插入和删除。所以我的解决方案是相同的,但是在开始时替换并且什么都不替换,见下文。
$row =~ s/(\d+)(??{"."*$1})//xg;
有谁知道为什么它不起作用或替代解决方案?
我也很乐意匹配不是插入或删除的任何内容,并将其设为新变量。
这是输入的示例:
$,.................................,,..................,, ....,,G。,,,,,..,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ,.,......,,,,......,,,,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,......,,......,,,,,, ,,,,,......,,,,,,,,,,,,,,,,,,,,,,,,,,.,,.,,,...... ....................,,.,........,.,.,,....,... ........,,......................,,,,,,...... .............,,,,,,,,........,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, .,,,,,,,,,,,,,,,,,,,,.+12GATGCTGTGTTT..,,,,,,,,.,,,,,,,,,,,,,,,, ,,,,,,,,.,,.,,-8tgatgctg,,,...,,..,,,,,,,,,,,,,,,,,,,,,,,, ,,,,..
这是我想要的输出示例:
$,.................................,,..................,, ....,,G。,,,,,..,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ,.,......,,,,......,,,,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,......,,......,,,,,, ,,,,,......,,,,,,,,,,,,,,,,,,,,,,,,,,.,,.,,,...... ....................,,.,........,.,.,,....,... ........,,......................,,,,,,...... .............,,,,,,,,........,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, .,,,,,,,,,,,,,,,,,,,,.+..,,,,,,,,.,,,,,,,,,,,,,,,, ,,,,,,,.,,.,,-,,,...,,..,,,,,,,,,,,,,,,,,,,,,,,,,, ,,..
干杯,
丹尼尔
python - 使用 pysam 提供的类属性在 Spark 中过滤 RDD
我正在使用pysam
Python 库来读取 Spark 中的 BAM 文件。我创建了一个包含“BAM”数据的 RDD。当我尝试使用类(pysam 库)filter
的属性来处理数据时,火花会崩溃。运行和工作正常。我对 Spark 很陌生。query_sequence
AlignedSegment
data.count()
data.first()
这是我的代码:
我得到以下输出:
bioinformatics - 如何使用 htslib/samtools 转换 SAM/BAM 读取?
我正在使用该htslib
库来读取 SAM/BAM 文件,它运行良好。我还可以将对齐写回新的 SAM/BAM 文件。
例如,以下代码打印比对的 DNA 序列:
问题:如何更改查询顺序?比如说,把第一个字母改成“T”?bam_get_seq
返回一个读的序列,但是没有bam_set_seq
函数?理想情况下,我正在寻找类似的东西:
如果我能弄清楚如何进行更新,我就知道如何将信息写入新的 SAM/BAM 文件。
bioinformatics - 如何使用 SAMtool htslib 库读取可选信息字段
我有一个 BAM 文件:
我需要阅读NM:i:0 AS:i:101 XS:i:0 RG:Z:group1
我的 C++ 代码中的可选字段。我可以使用该htslib
库来阅读除那些可选字段之外的所有内容。
htsib 库的源文件在Github 上。不幸的是,我找不到可以读取这些字段的函数。
问:如何使用 htslib 读取可选字段?