1

我需要注释文档中的空段落。我使用正则表达式模式进行注释。但它也涵盖了非空段落

示例输入文件:

<p class="MsoNormal"><a name="para10001">You can easily change the formatting</a></p>
<p class="MsoNormal"><a name="para10002"> </a></p>
<p class="MsoNormal"><a name="para10003"></a></p>
<p class="MsoNormal"><a name="para10004">To change the overall look of your document</a></p>
<p class="MsoNormal"><a name="para10005"></a></p>
<p class="MsoNormal"><a name="para10006"></a></p>

鲁塔脚本:

   "<p(.*?)><a name=\"para(\\d+)\"></a></p>"->EMPTYPASSAGE;
   "<p(.*?)><a name=\"para(\\d+)\"> </a></p>"->EMPTYPASSAGE;
                         or
   "<p(.*?)><a name=\"para(.+?)\"></a></p>"->EMPTYPASSAGE;
   "<p(.*?)><a name=\"para(.+?)\"> </a></p>"->EMPTYPASSAGE;
4

1 回答 1

1

您的正则表达式使用多个<p>标签。尝试类似:

"<p([^>]*?)><a name=\"para(\\d+)\"></a></p>"->EMPTYPASSAGE;
"<p([^>]*?)><a name=\"para(\\d+)\"> </a></p>"->EMPTYPASSAGE;
于 2016-10-28T07:20:45.110 回答