我对正则表达式非常陌生。我已经设法很久没有用一根 10 英尺长的杆子碰它了。到目前为止,我尽我所能避免它。但现在一个个人项目正在推动我学习它。
所以我开始了。我正在阅读位于此处的教程:http ://www.regular-expressions.info/tutorial.html
目前我在这里:http ://www.regular-expressions.info/repeat.html
我的问题是:
该教程说<[A-Za-z][A-Za-z0-9]*>
将匹配一个 HTML 标记。
但它不会也匹配无效的 html 标签,比如 -<h11>
或<h111>
?还有它如何匹配结束标签?
编辑 - 我的问题非常具体。我指的是一个特定教程中的一个特定示例,以澄清我对重复的理解是否正确。再一次,我重复一遍,我不关心用正则表达式解析 html。