0

Phpquery dom 解析器更改 javascript 标记内的内容。我使用以下代码

$pq         = phpQuery::newDocument($html);//$html -> grab the page using curl
echo $pq->html();

实际浏览器页面查看源

<script type="text/javascript">
    $('#div-id').append(
           '<div class="tool">'
                +'<div class="t1"></div>'
                +'<div class="t2"></div>'
           +'</div>'
   );
</script>

使用 phpquery dom 后

<script type="text/javascript">
        $('#div-id').append(
               '<div class="tool">'
                    +'<div class="t1"></script>
</div>'
                    +'<div class="t2"></div>'
               +'</div>'
       );
    </script>

另一个结束脚本标记是插入 dom 解析器。请帮助我如何解决这个问题。提前致谢

4

2 回答 2

0

我不确定这是否完全回答了您的问题,似乎它可能是一个错误,但这就是我发现的:

当我html()这样打电话时:$pq->html()我得到以下信息

<script type="text/javascript">
    $('#div-id').append(
           '<div class="tool">'
                +'<div class="t1"/>'
                +'<div class="t2"/>'
           +'</div>'
   );
</script>

但是当我这样做时:

foreach($pq->find('script') as $script){
    echo pq($script)->html();
}

我得到正确的 html

$('something else').append(
       '<div class="tool">'
            +'<div class="t1"></div>'
            +'<div class="t2"></div>'
       +'</div>'
);

我认为这是一个错误,我将报告它。如果我听到任何关于这件事的消息,我会告诉你的。

于 2013-01-08T03:53:30.067 回答
0

我在将 html 加载到 phpQuery 之前替换了所有脚本标记。并且在所有操作之后,替换回脚本。

function str_replace_once($search, $replace, $text)
{
    $pos = strpos($text, $search);
    return $pos!==false ? substr_replace($text, $replace, $pos, strlen($search)) : $text;
}
function replaceScripts($js_atricle_html){
    preg_match_all('/<script.*?>[\s\S]*?<\/script>/', $js_atricle_html, $tmp);
    $scripts_array = $tmp[0]; 
    foreach ($scripts_array as $script_id=>$script_item){
        $js_atricle_html = self::str_replace_once($script_item, '<div class="script_item_num_'.$script_id.'"></div>', $js_atricle_html);
    }

    return array('content'=> $js_atricle_html, 'scripts_array'=>$scripts_array);
}
function unreplaceScripts($aticle_content, $scripts_array){
    preg_match_all('/<div class="script_item_num_(.*?)"><\/div>/', $aticle_content, $tmp);
    foreach ($tmp[1] as $script_num_item){
        $aticle_content = str_replace('<div class="script_item_num_'.$script_num_item.'"></div>', $scripts_array[$script_num_item], $aticle_content);
    }
    return $aticle_content;
}
于 2016-04-28T10:48:53.950 回答