2

谢谢你把你的眼睛放在这里。

我正在处理数百个文本文件(1.txt、2.txt、3.txt ...)形式的一些光谱数据,它们都以完全相同的行数格式化,如下所示: :

1.txt:             2.txt:            3.txt:
1,5                1,4               1,7
2,8                2,9               2,14
3,10               3,2               3,5
4,13               4,17              4,9
<...>              <...>             <...>
4096,1             4096,7            4096,18

我正在尝试将它们逐行连接,因此我离开时会使用一个输出文件,例如:

5,4,7
8,9,14
10,2,5
13,17,9
<...>
1,7,18

我对 Python 很陌生,非常感谢这里的一些帮助。我试过这个烂摊子:

howmanyfiles=8
output=open('output.txt','w+')
for j in range(howmanyfiles):
    fp=open(str(j+1) + '.txt','r')
    if j==0:
        for i, line in enumerate(fp):
            splitline=line.split(",")
            output.write(splitline[1])
    else:
        output.close()
        output=open('output.txt','r+')
        for i, line in enumerate(fp):
            splitline=line.split(",")
            output.write(output.readline(i)[:-1]+","+splitline[1])
    fp.close()
output.close()

我在上面的思路是,我需要将光标放回每个文件的文档开头。但它真的在我面前爆炸了。

非常感谢。

-马特

4

2 回答 2

1

zip我认为您可以从内置函数中获得很多好处,它可以让您同时遍历所有输入文件:

from contextlib import ExitStack

num_files = 8
with open("output.txt", "w") as output, ExitStack() as stack:
    files = [stack.enter_context(open("{}.txt".format(i+1)))
             for i in range(num_files)]
    for lines in zip(*files): # lines is a tuple with one line from each file
        new_line = ",".join(line.partition(',')[2] for line in lines) + "\n"
        file.write(new_line)
于 2013-05-16T05:32:33.127 回答
0

这是使用生成器的一种有趣的方法:

import sys

files     = sys.argv[1:]
handles   = (open(f) for f in files)
readers   = ((line.strip() for line in h) for h in handles)
splitters = ((line.split(',')[1] for line in r) for r in readers)
joiners   = (",".join(tuple(s)) for s in splitters)

for j in joiners:
    print j

您还可以查看 Unix paste命令

于 2013-05-16T03:27:56.657 回答