问题标签 [samtools]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - samtools - dyld:库未加载:@rpath/libcrypto.1.0.0.dylib
我在其他地方看到过类似的其他一些问题,但我似乎找不到适合我的解决方案。我正在尝试在 anaconda 上使用 python 运行 samtools。我正在运行macosx catalina。这是错误代码
我已经尝试了各种努力通过 anaconda 安装早期版本的 openssl,但它仍然显示我安装了 openssl 版本 1.1.1。
感谢您提供有关如何(a)通过 anaconda 安装早期版本的 openssl 或(b)直接 samtools 以评估早期版本的不同路径或(c)任何其他解决方案的任何指导。
python-3.x - OSX Catalina 中的 Samtools 问题,命令行找不到 Samtools 的图像
在 OSX Catalina 上运行 samtools 时,我花了半天时间尝试各种方法来解决以下问题: dyld:未加载库:@rpath/libcrypto.1.0.0.dylib 引用自:/Users/brownbear/opt/anaconda3 /bin/samtools 原因:找不到图像 中止陷阱:6
我什至不能让命令行告诉我它是哪个版本(尽管我相信它是 1.9),似乎更新后的 conda 和 OSX 中的某些东西破坏了它。我在那里尝试了一切,但没有任何效果。我的最后一次尝试是这样,它奏效了......
是以下内容的组合: https ://www.biostars.org/p/173414/
https://github.com/bioconda/bioconda-recipes/issues/13488
总而言之,我首先做了
找到了目录,然后做了
然后跑
在此 samtools 工作后,检查版本时,结果如下:
祝大家编码愉快!
samtools - 如何使用 pysam 在 bam 文件中添加带有读取质量分数的“OQ”标签作为附加字段
我需要使用 OQ 标记将读取质量作为附加字段添加到使用 pysam 的 bam 文件中。
其他使用 samtools 等的传统方式会消耗更多时间并创建多个文件。
我尝试使用下面给出的脚本,但最终是无符号字符而不是质量得分字符串!任何帮助表示赞赏。
提前致谢。
例如。输入 bam:
预期输出 bam:
皮萨姆
python GenerateBamWithOQTag.py -i subset.bam -o subset_OQ.bam
bash - 使用 samtools 提取两个伴侣都未映射的未映射读取?
我正在尝试确定提取未映射读数的最佳方法,其中一对伴侣都没有映射。目前,我的代码似乎只是提取所有未映射的读取,而不管它们的伴侣如何。我不知道该怎么做,因为我已经在使用 -f 选项来提取未映射的读取。我会再做一次 samtools 视图的迭代吗?
r - 如何从 SRA 下载 BAM 文件?我有 SRA 工具包,但我很困惑
我正在尝试从 GEO/SRA 下载 BAM 格式的数据集,可用于在 RStudio 中进行分析。
我尝试使用这种方法:我下载 .sra 并将其转换为 .bam
但是,在 RStudio 中这不起作用,并返回一个错误,说它无法读取 bam 文件 这是我的 R 代码;我正在使用 RSamTools
有谁知道如何帮助我将 SRA 数据下载到可读的 .bam 文件中?任何帮助或指导将不胜感激,因为我真的想在最后期限之前完成。
terminal - 在终端中执行 samtools:“找不到命令”,但已安装
我已经安装了 samtools,我之前在我的电脑上使用过它。我现在正试图让它工作,但是当我在终端(mac os)中输入 samtools 时,它返回“找不到命令”。我也导航到了我的 samtools 文件夹,但它仍然无法正常工作。我错过了什么吗?谢谢您的帮助
pandas - 如何最有效地从 NarrowPeak (BED6+4) 格式文件中检索数据?
我正在从事一个生物信息学项目,该项目涉及非常大的 NarrowPeak格式文件,如下所示:
(列是 'chrom ,chromStart, chromEnd, name, score ,strand, signalValue ,pValue, qValue ,peak')
我有一种方法来索引文件(在 samtools 中使用 tabix)并通过输入 chr 编号和范围并获取正确的行来查询一行(我正在使用它,因为我的队友说这是最快的方法)。
例如,如果我的查询是 chr1:713835-714424 我会得到结果:
我希望能够输入 chr num 和 range 并单独获得分数 253。
我通过将结果转换为数据框(使用熊猫)来做到这一点。
有没有更好的办法?
如果有使用 samtools 的方法,那将是最好的,但我很难理解它。
谢谢
bash - 使用 bowtie2 对循环(for 循环)应用文件限制
您好,我只想对一组文件应用循环,但不是对我的所有文件都这样做,我只想对目录中的某些文件进行循环
这是我使用的命令,是基于 bowtie2 的基因组序列比对:
所以使用这个命令,bowtie2 会与我的所有文件对齐,但是鉴于在这个文件夹中有一些文件的 bowtie2 分析已完成,我不希望 bowtie2 再次对这些文件进行分析,所以,是否有任何子命令我可以添加到此循环以避免分析某些文件?
reverse - 使用 samtools faidx 提取反向 BLAST 匹配
我正在使用 samtools faidx 提取与 BLAST 输出文件给出的范围匹配的序列(格式为表格 -outfmt 6)。不幸的是,有正向和反向的 BLAST 匹配。samtools faidx 可以毫无问题地处理前向范围。反向范围导致 samtools 给出错误消息。
语法是:
在反向匹配的情况下(“$start”>“$end”),错误信息是:
有谁知道 samtools 是否可以处理带有特定标志的反向输入?我还没有找到适合这种情况的脚本,是的,这在生物科学中应该很常见!
sorting - 由于输入无效,无法使用 bcftools 对 VCF 进行排序
我正在尝试压缩和索引 VCF 文件并面临几个问题。
- 当我使用 bgzip/tabix 时,它会抛出一个错误,指出由于某些未排序的值而无法对其进行索引。
- 当我使用
bcftools sort
对此 VCF 进行排序以解决 #1 时,由于条目无效,它会引发错误。
- 我尝试使用 linux 命令进行排序以绕过#2。但是,当我运行下面的代码时, 的大小
fout.vcf
几乎是 的一半fin.vcf
,这表明可能出了问题。
如果您对以下方面有任何建议,请告诉我:
- 如何以安全可行的方式对 VCF 中有问题的输入进行排序/修复。(文件是340G,所以我不能简单地打开文件并编辑。)
- 为什么我的 linux
sort
可能会以一种奇怪的方式表现。(即返回的文件比原始文件小得多。)
任何意见或建议表示赞赏!