20

我发现了几个类似的问题,但到目前为止,没有一个能够帮助我。

我正在尝试在 HTML 块中输出所有图像的“src”,所以我正在使用DOMDocument(). 这种方法确实有效,但我在某些页面上收到警告,我不知道为什么。一些帖子建议隐藏警告,但我更愿意找出生成警告的原因。

警告:DOMDocument::loadHTML(): htmlParseEntityRef:实体中没有名称,行:10

产生错误的一个例子post->post_content是 -

On Wednesday 21st November specialist rights of way solicitor Jonathan Cheal of Dyne Drewett will be speaking at the Annual Briefing for Rural Practice Surveyors and Agricultural Valuers in Petersfield.
<br>
Jonathan is one of many speakers during the day and he is specifically addressing issues of public rights of way and village greens.
<br>
Other speakers include:-
<br>
<ul>
<li>James Atrrill, Chairman of the Agricultural Valuers Associates of Hants, Wilts and Dorset;</li>
<li>Martin Lowry, Chairman of the RICS Countryside Policies Panel;</li>
<li>Angus Burnett, Director at Martin & Company;</li>
<li>Esther Smith, Partner at Thomas Eggar;</li>
<li>Jeremy Barrell, Barrell Tree Consultancy;</li>
<li>Robin Satow, Chairman of the RICS Surrey Local Association;</li>
<li>James Cooper, Stnsted Oark Foundation;</li>
<li>Fenella Collins, Head of Planning at the CLA; and</li>
<li>Tom Bodley, Partner at Batcheller Monkhouse</li>
</ul>

post->post_content如果有帮助,我可以发布更多包含内容的示例?

我已暂时允许访问开发站点,因此您可以查看一些示例 [注意 - 问题已得到解答,链接不再可访问] -

有关如何解决此问题的任何提示?谢谢。

$dom = new DOMDocument();
$dom->loadHTML(apply_filters('the_content', $post->post_content)); // Have tried stripping all tags but <img>, still generates warning
$nodes = $dom->getElementsByTagName('img');
foreach($nodes as $img) :
    $images[] = $img->getAttribute('src');
endforeach;
4

8 回答 8

37

这个正确答案来自@lonesomeday 的评论。

那么我最好的猜测是在 HTML 中的某处有一个未转义的 & 符号。这将使解析器认为我们在实体引用中(例如 ©)。当它到达 ; 时,它认为实体已经结束。然后它意识到它所拥有的内容不符合实体,因此它发出警告并将内容作为纯文本返回。

于 2013-02-12T12:03:05.503 回答
22

正如这里提到的

警告:DOMDocument::loadHTML(): htmlParseEntityRef: 期待 ';' 在实体中,

您可以使用 :

libxml_use_internal_errors(true);

http://php.net/manual/en/function.libxml-use-internal-errors.php

于 2014-11-10T22:06:12.673 回答
1

在任何地方检查 HTML 代码中的“&”字符。由于这种情况,我遇到了这个问题。

于 2020-03-02T09:49:27.477 回答
0

我没有在上面发表评论所需的声誉,但htmlspecialchars在我的情况下使用解决了这个问题:

$inputHTML = htmlspecialchars($post->post_content);
$dom = new DOMDocument();
$dom->loadHTML(apply_filters('the_content', $inputHTML)); // Have tried stripping all tags but <img>, still generates warning
$nodes = $dom->getElementsByTagName('img');
foreach($nodes as $img) :
    $images[] = $img->getAttribute('src');
endforeach;

出于我的目的,我也在使用strip_tags($inputHTML, "<strong><em><br>"),所以所有图像标签也被删除了 - 我不确定这是否会成为问题。

于 2016-06-01T17:02:47.657 回答
0

我最终以正确的方式解决了这个问题,使用 tidy

// Configuration
$config = array(
    'indent'         => true,
    'output-xhtml'   => true,
    'wrap'           => 200);

// Tidy to avoid errors during load html
$tidy = new tidy;
$tidy->parseString($bill->bill_text, $config, 'utf8');
$tidy->cleanRepair();

$domDocument = new DOMDocument();
$domDocument->loadHTML(mb_convert_encoding($tidy, 'HTML-ENTITIES', 'UTF-8'));
于 2019-09-01T20:33:56.137 回答
0

对于 laravel,

使用 {{ }} 而不是 {!! !!}

我遇到了这个问题,我设法解决了它。

于 2020-07-22T10:17:54.860 回答
0

我发现我的表格标签中有错误。</td> 我删除了一个额外的内容并进行了宾果游戏。

于 2020-09-20T02:21:43.670 回答
-8

只需将字符串中的“&”替换为“and”即可。对所有其他符号执行此操作

于 2014-02-06T08:46:42.587 回答