我需要从一堆文档中替换一些句子。所有句子几乎相同,但在某些文档中存在中断、缺失或添加的单词/字符。我试图匹配第一个词和最后一个词,但那不准确。
有什么办法或有人知道如何替换几乎匹配的句子吗?
示例 假设我想替换以下句子。
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt
这是带休息的句子
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt
缺少的逗号
Lorem ipsum dolor sit amet, consetetur sadipscing elitr sed diam nonumy eirmod tempor invidunt
和缺字
Lorem ipsum dolor sit amet sadipscing elitr, sed diam nonumy invidunt