我在制表符分隔的床文件中有一组原始的基因组坐标(chrom、start、end)。我还有额外的制表符分隔的床文件,其中包含一些原始基因组坐标以及与这些坐标中的每一个相关的数值。这些坐标可以在床文件中多次显示,每次都具有不同的数值。我需要一个最终的床文件,其中包含每个原始基因组坐标以及与该特定坐标相关联的所有值的总和。我正在使用的文件示例如下。
原始文件:
chr1 2100 2300
chr2 3300 3600
chr1 2560 2800
其他床档:
chr1 2100 2300 6
chr2 3300 3600 56
chr1 2100 2300 10
需要的输出文件:
chr1 2100 2300 16
chr2 3300 3600 56
chr1 2560 2800 0
我需要编写一个 python 脚本来执行此操作,但我不确定最好的方法是什么。