2

我用这种方法得到波斯网页的内部 html:

private static function getInnerHTML($node)
{
    $innerHTML = "";
    $children = $node->childNodes;
    foreach ($children as $child) {
        $tmp_doc = new DOMDocument();
        $tmp_doc->appendChild($tmp_doc->importNode($child,true));
        $innerHTML .= $tmp_doc->saveHTML();
    }
    return $innerHTML;
}

当我在浏览器中看到源代码时,我发现波斯字符如下:

گزارش

我该怎么做才能将此编码转换为常规波斯字符?

例如,这个字符必须是: گزارش

对不起,我不知道这个编码是什么,所以我之前无法搜索它。

谢谢。

4

1 回答 1

1

根据我的评论,您需要的是html_entity_decode

$innerHTML .= html_entity_decode($tmp_doc->saveHTML());

演示

于 2014-02-17T07:00:14.133 回答