问题标签 [picard]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 如何从 Java 上的 BAM 文件格式中获取一致序列(通过 Picard)
如何使用 Java 查看 Picard BAM 文件格式?
bioinformatics - Picard SamToFastq 仅提取一次读取,然后引发错误
我正在尝试从 bam 文件中提取一些 FastQ 文件。Picard 可以使用 SamToFastq 执行此操作,正如该工具的文档中所说,它接受 bam 或 sam 文件。
但是当我运行它时,它只提取一次读取,然后退出。这是错误消息。任何帮助表示赞赏。
bioinformatics - GATK 无法识别 VCF4.2 文件
我见过很多人遇到同样的问题,但我还没有找到解决方案。我已经向 GATKs CombineVariants 提供了 24 个 VCF4.1 文件 ( http://evs.gs.washington.edu/EVS/ )。我收到此错误:
我曾在 GATKs 支持处询问过,但没有好的答案。我使用 VCFtools 进行验证,它们都通过了,但有两个非严重警告:
有谁知道?
java - 如何处理解压 hs37d5 fastq 文件导致的尾随垃圾
我真的试图解决这个问题,但似乎以前没有其他人遇到过这个问题。我从 1000G 解压了 fastq 文件:
但是,解压缩的文件夹有一些“尾随垃圾”,它会导致以下错误:
“线程“主”picard.PicardException 中的异常:序列名称在参考中出现多次:NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN”
尝试运行时:
如果有人可以给我一点帮助,将不胜感激。
bioinformatics - 无法识别的选项:我 picard.jar
我正在尝试使用 picard.jar 将 BMA 文件转换为 FASTQ 格式。这是我的命令:
但是我收到了这个错误信息:
错误:无法识别的选项:我
我完全糊涂了,有什么想法吗?
java - 如何为在 anaconda 环境中运行的 java 程序设置 RAM 和 CPU 参数?
在安装了 java 的标准 Linux 环境中,我可以使用以下命令运行任何 java 程序:
其中 picard 是 java 程序的一个示例。我还可以使用这种方式指定 JVM 应该使用多少 CPU 线程或 RAM:
该 JVM 将获得 5 个线程和 900 MB 的 RAM。一切都很直截了当。
但是,当我在 anaconda (conda) 环境中运行 java 程序时,它有自己的 java 安装,我只需键入它即可运行该软件:
如何将资源参数传递给 anaconda?默认参数是什么?
bioinformatics - picard markduplicate 切换 PCR 重复 samflag
我有一个 RNA-seq bam 文件,但很少有读数让我感到困惑。
根据bam头,这个bam文件是按坐标排序的,使用tophat创建的,markduplicate步骤没有做。但是一些读取在 samflag 中被标记为重复。更糟糕的是,当我运行 picard markduplicate 时,这些读取的 pcr 重复标志被切换,将它们标记为不重复。此外,我手动找到了此读取的副本(具有相同起始位置和配对起始位置的相同读取),因此初始标记看起来是正确的。
所以我的问题是:
知道为什么会发生这种情况吗?
Tophat 是否标记为重复?(我不这么认为)
如果读取已经被标记为重复,那么 picard markduplicate 是否会切换?
以下是标记重复步骤之前和之后读取的外观。
Before:
C0RTF 1187 17 7579880 255 61M10754N40M = 7579927 10902 CTC...
0UNP1 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC...
After Markduplicate
C0RTF 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC...
0UNP1 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC...
谢谢
sorting - Picard SortSam 加速?
我想知道如何加快 picard 的 SortSam?运行它需要很长时间,我知道 GATK 可以是多线程的,但我还没有在 Picard 上找到示例。
我想知道其他人如何解决这个问题?
python - linux合并picard中的多个文件
我有十个目录,每个目录有大约 10-12 个 bam 文件。我需要使用 picard 包将它们合并在一起,我想找到一种更好的方法。
如果它们不是顺序的,我如何使用变量添加输入,并且我想做这十个目录的 for 循环,但它们包含不同数量的 bam 文件。
我应该使用 python 或 R 来做还是继续使用 shell 脚本?请指教。
google-app-engine - 如何使用谷歌云上的 picard dock 将 fastq 转换为 uBAM
我一直在尝试将我在谷歌云上的 fastq 文件转换为 uBAM 文件,但到目前为止没有成功。这是我使用的代码:
我可以看到镜像已经被拉取并运行成功,但随后我收到错误消息说命令不正确,请检查 PicardcommandLine -h
有没有人有使用谷歌云将 fastq 转换为 uBAM 的经验?请帮忙。非常感激。谢谢你。