问题标签 [picard]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
477 浏览

r - R 如何获得多项式表达式的系数?

嗨,谢谢你的时间,

我意识到我的问题实际上与此线程中的问题非常相似:如何获取多项式表达式的系数

但是,我想详细说明这个问题。

我编写了一个程序,当给定一个向量,该向量填充了多项式内的单项式的升序系数时,将以类似的方式输出一个填充了该多项式基元系数的向量。例如,当我想知道表达式 y = 54s^2 - 36s + 3 的原语时,我会将向量 (3, -36, 54) 输入到我的程序中,它会返回向量 (0, 3, -18, 18) 因为这个 y 的原语是 18s^3 - 18s^2 + 3s。

该程序的代码如下:

现在这本身可能并非完美无缺,但它工作正常。然而,我现在遇到的问题是我希望能够以多项式的形式计算微分方程的 Picard 迭代。现在,我非常有信心自己可以编写这段代码,所以我只会询问与我继续工作相关的内容。

我本质上希望能够将任何表达式简化为多项式形式(如果表达式允许这样做,但我们假设它确实如此)。比如我的表达式是6(3s - 1)^2,那么我想让R把它简化为54s^2 - 36s + 6,并把它变成向量形式(6, -36, 54),这样我就可以用我写的程序原语运行它。我尝试使用包 rSympy 来获得以下内容:

这给了我输出

但是我不知道如何从此输出中获取(数字)向量 (6, -36, 54)。

在我链接的线程中,我看到他们使用了函数“gregexpr”。然而,我不知道这个函数做什么以及它是如何工作的,我一生都无法弄清楚我必须在这个函数中输入什么才能获得我需要的向量。我不喜欢编写我不理解的代码。请帮忙解释一下!

0 投票
2 回答
297 浏览

snakemake - 使用 Snakemake 包装器时,有没有办法为 Java VM 设置参数?

在使用类似picardfgbio通过snakemake 包装器之类的工具时,我一直遇到内存不足的问题。目前我求助于直接shell调用,这允许我设置虚拟机内存。我更愿意将这些参数传递给包装的工具。有没有办法,也许通过resources指令,传递类似的东西mem_mb=10000?我试过了,但还没有让它工作。

0 投票
0 回答
80 浏览

java - 一个有趣的 cron、bash、perl 和 java 问题

本质上,我有一个 perl 工作流,它通过系统命令运行一套 java 工具(对于那些熟悉 Broad Institute 软件的人来说,GATK4 中的 picard)。如果成功,这些 gatk4 命令返回代码 0。当我手动启动 perl 工作流程(RHE7.6)时,一切似乎都很好。

但是,成功时返回 0 的 Gatk4 进程会在相同的工作流作为 cron 作业的一部分运行时失败,如下所示:

0,15,30 * * * * /usr/bin/flock -n /tmp/QAQC.lock -c "/seq/QAQC/bin/launch_QAQC.pl 1>>launch_QAQC.log 2>>launch_QAQC.err"

我怀疑使用-c 选项运行flock 会导致这些作业(以及perl 管道)中止。

您可以提供的任何见解将不胜感激。

谢谢

编辑:找出解决方案,因为问题不在于羊群。Cron 没有看到与交互式 shell 相同的环境变量。

0 投票
0 回答
104 浏览

rna-seq - MarkDuplicates Picard

我正在使用 Picard 仅标记我阅读了 MarkDuplicates 手册的光学副本。我的脚本看起来像这样

当我使用 samtool 标志 0x400 时,我不确定我是否只得到光学副本,此时的任何建议都非常感谢。

0 投票
0 回答
61 浏览

python - 为什么 subprocess.Popen() 不提供实时提要?

我正在为生物信息学工具开发一个自动化框架。由于我的程序将使用的大多数软件都是为 Linux 编写的,而不是用 python 编写的,所以我使用 subprocess 来调用这些进程。我遇到的问题是管道中的许多步骤需要很长时间,我想查看实时输出,所以我知道它仍在工作并且没有挂起或其他东西。但我还需要在该过程完成后捕获输出以记录任何意外错误。

我发现 subprocces.Popen() 是我解决这个问题所需要的。

这是我使用的代码(在这里找到:https ://fabianlee.org/2019/09/15/python-getting-live-output-from-subprocess-using-poll/ ):

当我使用这个简单的 bash 脚本作为参数时,它就像一个魅力:

这给出了输出:

或者如果我故意在脚本中插入错误,例如:

但是,当我使用(在这种情况下为 picard ValidateSamFile)尝试它时,无论我尝试了什么,它都不会给我任何 livefeed:

该过程完成后我得到这个:

有任何想法吗?

0 投票
0 回答
23 浏览

bash - MarkDuplicates 错误无法创建 Java 虚拟机

我已经在github上发布了这个,以便开发人员可以回答。但是我已经查看了有关堆栈溢出的类似问题,但这似乎是一个特定问题,因为我的同事使用了类似的脚本并且它对他们有用。

我正在尝试使用 Picard 标记重复项。这是一个最小测试用例的 bash 脚本:

问题:我收到以下错误:

我是 bash 脚本的新手,之前没有使用过 Picard。