Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
可能重复: 正则表达式匹配打开的标签,XHTML 自包含标签除外
为什么使用正则表达式进行 HTML/XML 解析不是一个好主意?
因为这些语言不规则。它们不符合正则表达式的预期用途。使用 XPath 之类的东西进行 XML 解析要好得多。
好的,明白了:HTML/XML 是 Chomsky Type 2 语法,而正则表达式是 Chomsky Type 3 语法,因此后者的表达能力不足以解析前者。