问题标签 [picard]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

16 问题

0 投票

1 回答

642 浏览

java - 如何从 Java 上的 BAM 文件格式中获取一致序列（通过 Picard）

如何使用 Java 查看 Picard BAM 文件格式？

2012-06-05T15:29:21.783

0 投票

1 回答

1108 浏览

bioinformatics - Picard SamToFastq 仅提取一次读取，然后引发错误

我正在尝试从 bam 文件中提取一些 FastQ 文件。Picard 可以使用 SamToFastq 执行此操作，正如该工具的文档中所说，它接受 bam 或 sam 文件。

但是当我运行它时，它只提取一次读取，然后退出。这是错误消息。任何帮助表示赞赏。

bioinformatics dna-sequence fastq picard bam

2012-06-20T13:41:08.380

0 投票

0 回答

981 浏览

bioinformatics - GATK 无法识别 VCF4.2 文件

我见过很多人遇到同样的问题，但我还没有找到解决方案。我已经向 GATKs CombineVariants 提供了 24 个 VCF4.1 文件 ( http://evs.gs.washington.edu/EVS/ )。我收到此错误：

我曾在 GATKs 支持处询问过，但没有好的答案。我使用 VCFtools 进行验证，它们都通过了，但有两个非严重警告：

有谁知道？

bioinformatics vcf-variant-call-format vcftools picard

2013-11-12T16:04:16.620

0 投票

0 回答

407 浏览

java - 如何处理解压 hs37d5 fastq 文件导致的尾随垃圾

我真的试图解决这个问题，但似乎以前没有其他人遇到过这个问题。我从 1000G 解压了 fastq 文件：

但是，解压缩的文件夹有一些“尾随垃圾”，它会导致以下错误：

“线程“主”picard.PicardException 中的异常：序列名称在参考中出现多次：NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN”

尝试运行时：

如果有人可以给我一点帮助，将不胜感激。

java gzip picard

2015-09-23T12:51:58.330

0 投票

2 回答

447 浏览

bioinformatics - 无法识别的选项：我 picard.jar

我正在尝试使用 picard.jar 将 BMA 文件转换为 FASTQ 格式。这是我的命令：

但是我收到了这个错误信息：

错误：无法识别的选项：我

我完全糊涂了，有什么想法吗？

bioinformatics fastq picard

2016-07-21T09:18:28.587

0 投票

1 回答

1101 浏览

java - 如何为在 anaconda 环境中运行的 java 程序设置 RAM 和 CPU 参数？

在安装了 java 的标准 Linux 环境中，我可以使用以下命令运行任何 java 程序：

其中 picard 是 java 程序的一个示例。我还可以使用这种方式指定 JVM 应该使用多少 CPU 线程或 RAM：

该 JVM 将获得 5 个线程和 900 MB 的 RAM。一切都很直截了当。

但是，当我在 anaconda (conda) 环境中运行 java 程序时，它有自己的 java 安装，我只需键入它即可运行该软件：

如何将资源参数传递给 anaconda？默认参数是什么？

java anaconda picard

2017-05-25T09:19:19.300

0 投票

0 回答

43 浏览

bioinformatics - picard markduplicate 切换 PCR 重复 samflag

我有一个 RNA-seq bam 文件，但很少有读数让我感到困惑。

根据bam头，这个bam文件是按坐标排序的，使用tophat创建的，markduplicate步骤没有做。但是一些读取在 samflag 中被标记为重复。更糟糕的是，当我运行 picard markduplicate 时，这些读取的 pcr 重复标志被切换，将它们标记为不重复。此外，我手动找到了此读取的副本（具有相同起始位置和配对起始位置的相同读取），因此初始标记看起来是正确的。

所以我的问题是：
知道为什么会发生这种情况吗？
Tophat 是否标记为重复？（我不这么认为）
如果读取已经被标记为重复，那么 picard markduplicate 是否会切换？

以下是标记重复步骤之前和之后读取的外观。
Before:
C0RTF 1187 17 7579880 255 61M10754N40M = 7579927 10902 CTC...
0UNP1 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC...

After Markduplicate
C0RTF 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC...
0UNP1 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC...

谢谢

bioinformatics samtools picard

2017-10-25T21:14:02.173

0 投票

1 回答

500 浏览

sorting - Picard SortSam 加速？

我想知道如何加快 picard 的 SortSam？运行它需要很长时间，我知道 GATK 可以是多线程的，但我还没有在 Picard 上找到示例。

我想知道其他人如何解决这个问题？

sorting bioinformatics picard

2017-10-27T15:23:36.723

0 投票

1 回答

442 浏览

python - linux合并picard中的多个文件

我有十个目录，每个目录有大约 10-12 个 bam 文件。我需要使用 picard 包将它们合并在一起，我想找到一种更好的方法。

如果它们不是顺序的，我如何使用变量添加输入，并且我想做这十个目录的 for 循环，但它们包含不同数量的 bam 文件。

我应该使用 python 或 R 来做还是继续使用 shell 脚本？请指教。

python linux variables for-loop picard

2017-12-22T03:07:53.743

0 投票

1 回答

308 浏览

google-app-engine - 如何使用谷歌云上的 picard dock 将 fastq 转换为 uBAM

我一直在尝试将我在谷歌云上的 fastq 文件转换为 uBAM 文件，但到目前为止没有成功。这是我使用的代码：

我可以看到镜像已经被拉取并运行成功，但随后我收到错误消息说命令不正确，请检查 PicardcommandLine -h

有没有人有使用谷歌云将 fastq 转换为 uBAM 的经验？请帮忙。非常感激。谢谢你。

google-app-engine google-cloud-platform google-genomics picard

2018-06-10T12:01:06.547

1 2 3 4 5 6 7 8 9 10

问题标签 [picard]

Reference