我有两条路
path1 = "/home/x/nearline"
path2 = "/home/x/sge_jobs_output"
在 path1 中,我有一堆 fastq 文件:
ERR001268_1.recal.fastq.gz
ERR001268_2.recal.fastq.gz
ERR001269_1.recal.fastq.gz
ERR001269_2.recal.fastq.gz
.............
在path2中,我有很多.txt对应于path1中的fastq文件:
ERR001268_1.txt
ERR001268_2.txt
ERR001269_1.txt
ERR001269_2.txt
.............
现在我已经制作了脚本来从 path1 中的 fastq 文件计算 fastq_seq_num,见下文:
for file in os.listdir(path1):
if re.match('.*\.recal.fastq.gz', file):
fullpath1 = os.path.join(path1, file)
#To calculate the sequence number in fastq.gz files
result = commands.getoutput('zcat ' + fullpath1 + ' |wc -l')
fastq_seq_num = int(result)/4.0
print file,fastq_seq_num
并且还从 path2 中的 .txt 文件计算 num_seq_processed_sai,见下文:
for file in os.listdir(path2):
if re.match('.*\.txt', file):
fullpath2 = os.path.join(path2, file)
#To calculate how many sequences have been processed in .sai file
linelist = open (fullpath2,'r').readlines
lastline = linelist[len(linelist)-1]
num_seq_processed_sai = lastline.split(']')[1].split()[0]
print file,num_seq_processed_sai
好的,现在我的问题是:我想创建一个循环,在其中计算 path1 中第一个 fastq 文件的 fastq_seq_num;然后计算path2中FIRST txt文件的num_seq_processed;然后比较这两个数字;然后结束循环。然后第二个循环开始......我怎样才能设计一些循环来实现这一点?谢谢!!!