在尝试使用 php 和 preg* 函数进行一些 html 抓取之前,我曾多次遇到过这个问题。
大多数时候我必须捕捉这样的结构:
<!-- comment -->
<tag1>lorem ipsum</tag>
<p>just more text with several html tags in it, sometimes CDATA encapsulated…</p>
<!-- /comment -->
特别是我想要这样的东西:
/<tag1>(.*?)<\/tag1>\n\n<p>(.*?)<\/p>/mi
但\n\n看起来不起作用。
有通用的断线开关吗?