我想比较两个文档而不考虑换行符。如果内容相同但换行符的位置和数量不同,我想将一个文档中的行映射到另一个文档中的行。
鉴于:
文件 1
I went to Paris in July 15, where I met some nice people.
And I came back
to NY in Aug 15.
I am planning
to go there soon
after I finish what I do.
文件 2
I went
to Paris
in July 15,
where I met
some nice people.
And I came back to NY in Aug 15.
I am planning to go
there soon after I finish what I do.
我想要一种算法,能够确定文档 1 中的第 1 行包含与文档 2 中的第 1 到第 5 行相同的文本,文档 1 中的第 2 行和第 3 行包含与文档 2 中的第 6 行相同的文本,等等。
1 = 1,2,3,4,5
2,3 = 6
4,5,6 = 7,8
如果正则表达式跨越其他文档中的多行,是否有办法匹配每个文档中的每一行?