这是我从网页中提取的相同代码...
<div class="user-details-narrow">
<div class="profileheadtitle">
<span class=" headline txtBlue size15">
Profession
</span>
</div>
<div class="profileheadcontent-narrow">
<span class="txtGrey size15">
administration
</span>
</div>
</div>
<div class="user-details-narrow">
<div class="profileheadtitle">
<span class=" headline txtBlue size15">
Industry
</span>
</div>
<div class="profileheadcontent-narrow">
<span class="txtGrey size15">
banking
</span>
</div>
</div>
我想要实现的是在这些 DIV 中提取数据。例如...
职业=管理员行业=银行
目前我正在用 Curl 拉网页,然后去掉 html 标签,并使用数百个 preg_match 和 if 函数。虽然该解决方案运行良好,但它确实使用了大量的 CPU 和内存。
有人建议我改用 DOMDocument ,但我似乎无法工作,主要是由于缺乏知识。
有人可以告诉我如何提取这些数据吗?