问题标签 [snakemake]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
134 浏览

python - bioconda:没有这样的文件或目录仔细构建

我正在尝试verifybamid为 bioconda 构建一个新包 ()。我在一个最小的 Linux VM 上运行它,并设置了 docker、conda、bioconda-utils 等。conda build verifybamid作品。当我一开始尝试./simulate-travis.py --packages verifybamid --loglevel=debug一切正常时,但最终我得到了No such file or directory: mulled-buildtest_package() 的调用。根据bioconda-utils

由于 mulled-build 和 involucro,现在每个构建的包都可以在一个隔离的 busybox 容器中进行测试。这将捕获配方未能在运行依赖项中指定库(例如,libgcc)的问题。

但是我必须安装哪个软件包才能使它工作?

谢谢, 安德烈亚斯

0 投票
1 回答
435 浏览

cluster-computing - Snakemake 集群配置结合 DRMMA

我有一个与drmma 和snakemake 中的集群配置文件有关的问题。

目前我有一个管道,我使用 drmma 和以下命令将作业提交到集群:

问题是一些规则/作业需要更少或更多的资源。我虽然如果我使用 json 集群文件,我将能够提交具有不同资源的作业。我的 json 文件如下所示:

当我运行以下命令时,我的作业(job1 和 job2)使用默认选项而不是自定义选项提交:

我究竟做错了什么?是不是我不能将 drmaa 选项与 cluster-config 文件结合起来?

0 投票
1 回答
1087 浏览

snakemake - Snakemake:未输入的依赖项

我想知道 Snakemake 中是否有一种方法可以定义一个实际上不是输入文件的依赖项。我的意思是,有些程序期望某些文件存在,而命令行上没有提供。

让我们bwa作为一个例子来考虑。这是来自Johannes Köster 映射规则的规则

在这里,bwa 期望基因组索引文件存在,而它不是命令行参数(索引文件的路径是从基因组路径推导出来的)。

有没有办法告诉 Snakemake 索引文件是一个依赖项,如果 Snakemake 知道如何生成这个文件,他会查看它的规则吗?

我想您仍然可以将规则输入重写为:

并相应地调整规则run部分。这是最好的解决方案吗?

提前致谢。拜诺伊斯特

0 投票
1 回答
626 浏览

python - Snakemake 抱怨它在运行指令中找不到它应该创建的文件

考虑以下简单的蛇文件,它尝试在run指令中写入文件:

运行它会产生以下结果:

我对此感到惊讶FileNotFoundError。显然,我没有找到正确的方法告诉snakemake 这是我希望规则make_test创建的文件。

我还尝试了对输出语法的以下修改:

错误是一样的。

发生了什么?

0 投票
4 回答
4670 浏览

snakemake - snakemake:有没有办法为每个规则指定一个输出目录?

我使用的所有脚本都将输出文件放在调用脚本的当前目录中,因此在我的 shell 脚本管道中,我将使用 cd 命令转到特定目录以运行命令,并且输出文件将仅保存在相关目录中。我的脚本没有输出目录的参数,并且大多数脚本都从输入中推断出输出文件名。这对我来说效果很好。

现在我一直遇到这个输出目录问题,因为snakemake似乎将文件输出到 Snakefile 所在的目录。我可以修改所有脚本以获取输出目录的附加参数,但这对于修改许多脚本来说已经很痛苦了。我想知道是否有任何方法可以指定每个特定规则的输出位置?

0 投票
2 回答
1261 浏览

python - Snakemake 中当前规则的名称

我正在使用 Snakemake,但找不到访问当前规则 name 的方法。

例如,有没有办法获得这样的访问权限:

check_inputs当每个规则的功能或多或少相同时,这可能非常有用。

当然,我做了这个并且它有效:

但是,我想知道是否存在更多“Snakemaker 方式”来获取当前规则的名称,以避免每次都编写/硬编码规则的名称。

任何形式的帮助或建议将不胜感激。

--- EDIT1 ---只有当和语句由snakemake解析时,才能
访问规则名称。所以在/定义中是不可能使用的。{rules.myrule.name}inputoutput{rules.myrule.name}inputoutput

例如,这个想法是为了快速访问当前规则的名称{rules.current},因为{rules.myrule.name}它也是重复的。

0 投票
2 回答
2052 浏览

snakemake - Snakemake:删除输出文件

我看不到如何使用 Snakemake 规则删除已变得无用的 Snakemake 输出文件。

具体来说,我有一个规则bwa_mem_sam可以创建一个名为{sample}.sam. 我有另一个规则,bwa_mem_bam它创建一个名为{sample.bam}.

这两个文件是否包含不同格式的相同信息,我想删除第一个文件无法成功。

任何帮助将不胜感激。本。

0 投票
2 回答
1314 浏览

python-3.x - 在 Snakemake 中重用规则

有没有办法重用snakemake中的规则只改变params

例如:

job1job2规则做同样的事情,但我需要连续调用它们并且reference必须修改参数。它为非常相似的任务生成大量代码。

我尝试为这一步制作一个子工作流程,主 Snakefile 更具可读性。但是,子工作流代码仍然重复。

有什么想法或建议吗?我错过了什么?

编辑
更具体地说,job2 必须在 job1 之后执行,使用后者的输出。

0 投票
1 回答
83 浏览

installation - 在没有互联网的情况下安装snakemake

我正在一个禁止互联网通信的站点上工作。是否可以在没有 conda 的情况下安装snakemake?

谢谢,米歇尔

0 投票
1 回答
180 浏览

snakemake - Snakemake + tmux

My workflow often includes PBS job submissions to a shared cluster that need to either wait in the scheduling queue, take over 24hrs to run or both. I'd like to run snakemake in the 'background' and get my prompt back while these jobs are running. I know this can be done using tmux, screen, or & but is there is a better way to do this?

I guess submitting a bash wrapper script with the snakemake commands inside is an option but I think I'm lacking some understanding of the workflow.