$dom = new DOMDocument('1.0', 'UTF-8');
$dom->loadHTML($content);
$divs = $dom->getElementsByTagName("div");
foreach ( $divs as $div ) {
if ( $class = $div->attributes->getNamedItem("class") ) {
if ( $class->nodeValue == "simplegalleryholder" )
$div->parentNode->removeChild( $div );
}
}
$content = $dom->saveHTML();
这个简单的代码应该可以帮助我删除
<div class="simplegalleryholder"> .... </div>
从文档中。唯一的问题是,$content 包含 utf8 编码的特殊字符(ąęść 等),这些字符会被进程破坏(我得到 iÄ™ Å, ż 代替)。
我应该如何处理这个问题以获得正确的结果?