我希望 StackOverflow 指南允许这种类型的编程问题,否则,如果我错了,请纠正我!
我一直在从事具有生物信息学目的的蛇形工作流程。我现在拥有的文件是一个带有多种基因座标签的文本文件。我需要从这些基因座标签中获取序列。我一直在研究snakemake的文档,但仍然无法找到正确的库函数来根据基因座标签和生物体检索序列......我现在拥有的代码:
rule get_id:
input:
a="RNA-Seq-counts.txt"
output:
b="output.txt"
shell:
"python RetrieveFirstColumn.py {input} {output}"
output.txt 的输出
lp_0001
lp_0002
lp_0004
lp_0005
lp_0009
lp_0010
lp_0011
lp_0012
lp_0013
lp_0014
lp_0015
lp_0016
lp_0017