python - 查找并替换整行python

Question

我有一个这样的文件..

xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
a b c invalid #seperated by tab
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx

我需要替换a b c invalid为a b reviewed rd # separated by tab 基本上任何以无效结尾的行，我需要替换该行，reviewed rd // separated by tab但我必须保留该行的第一个和第二个单词（仅替换第 3 个和第 4 个）。

我已经开始做这样的事情，但这不会完全符合我的要求。

f1 = open('fileInput', 'r')
f2 = open('fileInput'+".tmp", 'w')
for line in f1:
    f2.write(line.replace('invalid', ' reviewed'+\t+'rd'))
f1.close()
f2.close()

regex可以是一个选择，但我还不是很好。有人可以帮忙吗。

PS a、b 和 c 是变量。我无法对“a”、“b”、“c”进行精确搜索。

score 2 · Accepted Answer

f1 = open('fileInput', 'r')
f2 = open('fileInput+".tmp"', 'w')
for line in f1:
    if line[:-1].endswith("invalid"):
        f2.write("\t".join(line.split("\t")[:2] + ["reviewed", "rd"]) + "\n")
    else:
        f2.write(line)
f1.close()
f2.close()

score 2 · Accepted Answer

import re

pattern = re.compile(r'\t\S+\tinvalid$')
with open('data') as fin:
    with open('output', 'w') as fout:
        for line in fin:
            fout.write(pattern.sub('\treviewd\trd', line))

score 1 · Accepted Answer

with open('input.tab') as fin, open('output.tab', 'wb') as fout:
    tabin = csv.reader(fin, delimiter='\t')
    tabout = csv.writer(fout, delimiter='\t')
    for row in tabin:
        if len(tabin) != 4:
            continue # or raise - whatever
        if row[-1] == 'invalid':
            tabout.writerow(row[:2] + ['reviewed', 'rd'])

python - 查找并替换整行python

3 回答 3

Related

Reference