需要你的帮助。我必须删除所有行,直到从 file2 遇到第一个 '>' 并将这些行附加到 file1 的末尾。实际上,我已经使用 linux 的“split”命令将一个大文件拆分为多个小文件,并且一些条目(以“>”开头)分布在两个文件中。所以,我只想通过将提醒条目复制回一个文件来拼接这些条目。
示例文件 1:
>1
AAAAAAAAAAAAAA
CGGGGGGGGGGGGG
DEEEEEEEEEEEEE
示例文件 2:
AFGGGGGGGGGGGG
DEEEEEEEEEEE
>2
AAAABBBBBBBBB
DFFFFFFFFFFFFF
DFFFFFFFSSSS
在上面的示例中,File2 的前两行属于 File1,因此需要从 File2 中删除并附加到 File1 的末尾。
一种方法可能是:
fh1 = open(file1,'a')
fh2 = open(file2, 'r+')
filelist2 = file2.split('>')
string = filelist2[0]
fh1.write(string)
<SOME WAY TO REMOVE LINES TILL SYMBOL FROM FILE1>
fh1.close()
fh2.close()
我知道有几种方法可以实现这一点,但问题是这两个文件都很大~600MB。此外,这将通过一个循环在 4~10 个文件上完成。因此,我正在寻找最有效和最快的方法,因此需要您的建议。
等待您的建议
AK