2

我需要从一堆文档中替换一些句子。所有句子几乎相同,但在某些文档中存在中断、缺失或添加的单词/字符。我试图匹配第一个词和最后一个词,但那不准确。

有什么办法或有人知道如何替换几乎匹配的句子吗?

示例 假设我想替换以下句子。

Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt

这是带休息的句子

Lorem ipsum dolor sit amet, consetetur sadipscing elitr,
sed diam nonumy eirmod tempor invidunt

缺少的逗号

Lorem ipsum dolor sit amet, consetetur sadipscing elitr
sed diam nonumy eirmod tempor invidunt

和缺字

Lorem ipsum dolor sit amet sadipscing elitr, sed diam nonumy invidunt
4

1 回答 1

1

未经测试,但请查看similar_text();

    <?php
$threshold = 80; //Percentage threshold
    $par1 = "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod tempor invidunt";
    $par2 = "Lorem ipsum dolor sit amet, consetetur sadipscing elitr, 
    sed diam nonumy eirmod tempor invidunt";

    $percent = similar_text($par1,$par2);
    if ($percent < $threshold) {
        //Correct the incorrect paragraph
        $par2 = $par1;
    }
    ?>
于 2013-01-15T12:15:47.460 回答