我正在努力从字符串中提取内容(存储在数据库中)。每个div就是一个章节,h2内容就是标题。我想分别提取每章的标题和内容(div)
<p>
<div>
<h2>Title 1</h2>
Chapter Content 1 with standard html tags (ex: the following tags)
<strong>aaaaaaaa</strong><br />
<em>aaaaaaaaa</em><br />
<u>aaaaaaaa</u><br />
<span style="color:#00ffff"></span><br />
</div>
<div>
<h2>Title 2</h2>
Chapter Content 2
</div>
...
</p>
我在php中尝试过preg_match_all,但是当我有标准的html标签时它不起作用
function splitDescription($pDescr)
{
$regex = "#<div.*?><h2.*?>(.*?)</h2>(.*?)</div>#";
preg_match_all($regex, $pDescr, $result);
return $result;
}