0

在我的项目中,我想从我使用 dom 方法的网页中检索标签。

但是标签可以像动态创建一样document.write(“<a href=”http://somedomain.com”>”);

这里的标签以字符串的格式给出,所以我尝试使用正则表达式。

我想要一个匹配所有标签和属性的正则表达式,只要该表达式也应该能够提取特定属性

4

1 回答 1

0

很难理解你在问什么,而且很不清楚。

首先:如果你有一个选项,永远不要使用正则表达式来解析 HTML。看起来很简单吧?不,你迟早会发现问题。

第二:大卫所说的。

现在这是一个匹配任何 HTML 标签的正则表达式(没有测试过它或任何东西,所以如果必须先尝试一下):

\<[^>]*\>

请注意,它也会匹配脚本标签(不要让用户在您的页面上写入任何标签,如果必须将一些标签列入白名单,并且如果您不使用库,请准备好遇到麻烦)。

例如,在RegExr上尝试这些(但请注意,它使用 ActionScript 正则表达式,有时可能与 Javascript 的正则表达式不同,例如 Javascript 没有前瞻/后瞻。

于 2012-04-10T09:24:36.873 回答