0

这种线怎么搭配

<p><span class="font7" style="font-weight:bold;">text text text text </span></p>\r\n<p>

同时避免这种线

<p><span class="font7" style="font-weight:bold;">text text text text </span><span class="font7"> text text text <br/> text text text </span></p>\r\n<p>

问题是标签跨度在同一行出现两次,我想避免这种情况。只希望 if 在一行中出现一次。

</span> 

我试过这个正则表达式

<p><span class="font7" style="font-weight:bold;">.+?(?:(?!.+?</span>.+?$)){2}</p>\r\n<p>

请帮助我,如果可能的话,使用 .net、perl 或 ruby​​ 风味

问候

4

1 回答 1

1

不要尝试使用正则表达式解析 HTML。你不能可靠地做到这一点。正则表达式不能胜任这项任务。

您需要一个合适的 HTML 解析器。它将是一个经过充分测试并被许多人使用的 HTML 解析器,而不是你试图拼凑的任何正则表达式。

下面是Perl HTML 解析器的一些选项。从那里开始。

于 2012-12-15T03:38:01.270 回答