我希望将许多文件与一些常见模板进行匹配,并提取差异。我想就最好的方法提出建议。例如:
模板 A:
<1000 text lines that have to match>
a=?
b=2
c=3
d=?
e=5
f=6
<more text>
模板 B:
<1000 different text lines that have to match>
h=20
i=21
j=?
<more text>
k=22
l=?
m=24
<more text>
如果我传入文件 C:
<1000 text lines that match A>
a=500
b=2
c=3
d=600
e=5
f=6
<more text>
我想用一种简单的方法说这与模板 A 匹配,并提取“a=500”、“d=600”。
我可以将这些与正则表达式匹配,但文件相当大,构建该正则表达式会很痛苦。
我也尝试过 difflib,但解析操作码和提取差异似乎不是最佳的。
有人有更好的建议吗?