我正在尝试制作一些用于遗传分析的 .bed 文件。我是python初学者。我要制作的文件应该是 3 列,制表符分隔,第一列始终相同(染色体编号),第二列和第三列窗口大小为 200,从零开始,到染色体末端结束。例如:
chr20 0 200
chr20 200 400
chr20 400 600
chr20 600 800
...
我有染色体的大小,所以目前我想说'而第 2 列 <(铬的大小)打印线。我有一个脚本的骨架,但由于我缺乏经验,它不能很好地工作。这是我到目前为止所拥有的:
output = open('/homw/genotyping/wholegenome/Chr20.bed', 'rw')
column2 = 0
column1 = 0
while column2 < 55268282:
for line in output:
column1 = column1 + 0
column2 = column2 + 100
print output >> "chr20" + '\t' + str(column1) + '\t' + str(column2)
如果有人可以修复这个简单的脚本,使其按照我描述的方式运行,或者编写一个更好的解决方案,那将不胜感激。我考虑制作一个脚本,可以输出 20 条染色体和 chrX 的所有文件,但由于我需要指定染色体的大小,我认为我必须分别处理每个文件。
提前致谢!