1

我需要获取 html 页面中所有“标题”属性的值。我使用树枝模板,所以源代码可以是:

<a href="#" title="some {% func "smth" %} text">

我使用此代码获取标题值:

/<[a-z]+[^>]*\s+(title|alt)\s*=\s*("[^"]*")/ 

但是当标题有{% func "smth" %}我得到下一个字符串时:

"some {% func "

如何获得完整的字符串?

更新: DOM 不是一个解决方案,因为它会将上面的示例链接解释为

<a href="#" title="some {% func " smth text></a>
4

1 回答 1

1

这似乎对我有用:

/<[a-z]+[^>]*\s+(title|alt)\s*=\s*(".*")/ 

问题是[^"]阻止任何引号,例如"smth". 正则表达式中的关闭"会发现字符串的结尾很好。

于 2011-07-25T12:36:35.313 回答