我正在用 curl 解析一些 html 代码。某些网站的 html 源代码,例如:
<div id="content">
some words
</div>
<?
$box_social['dimensioni']="80";
$box_vota=array();
$box_vota["novideo"]='';
$box_vota["nofoto"]='';
$box_vota["id_articolo"]='1003691';
include($_SERVER['DOCUMENT_ROOT']."/incs/box_social.php");
?>
<div id="footer">
some words
</div>
如何从 html 源代码中删除 php 短标签?我需要
<div id="content">
some words
</div>
<div id="footer">
some words
</div>
我使用preg_replace('/<\?(.*?)\?>/','',$html);
,但 php 短标签部分仍然存在。