您好,我有一些 html,我尝试使用正则表达式来查找所有获得 itemprop 属性的 HTML 标记。
我想使用正则表达式,因为我不确定 HTML 的完整性。
我试过这个正则表达式。
<(?<balise>.+)>(?(balise).*itemprop=.*)
我想在我的组中匹配一个模式,但它不起作用。
有人可以帮助我
文本解析示例
<meta itemprop="currency" content="CDN" >
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" lang="fr" xmlns:og="http://ogp.me/ns#" xmlns:fb="http://www.facebook.com/2008/fbml">
<head><span itemprop="name">My name</span>
我只需要提取获取 itemprop 的 html 标签