-1

可能重复:
正则表达式匹配打开的标签,XHTML 自包含标签除外

为什么使用正则表达式进行 HTML/XML 解析不是一个好主意?

4

2 回答 2

2

因为这些语言不规则。它们不符合正则表达式的预期用途。使用 XPath 之类的东西进行 XML 解析要好得多。

于 2012-11-05T22:55:14.590 回答
0

好的,明白了:HTML/XML 是 Chomsky Type 2 语法,而正则表达式是 Chomsky Type 3 语法,因此后者的表达能力不足以解析前者。

于 2012-11-05T23:05:44.743 回答