-1

我正在尝试解析一些非英文页面并提取相关信息,然后在不同的 html 页面中显示提取的信息。但是,我可以使用 PHP Dom 解析器(simple_html_dom)成功提取相关文本,但是我无法以原始语言显示提取的文本。我制作了简单的脚本,可以简单地从 URL 获取文本并显示

header('内容类型: text/html; charset=utf-8');
$html = str_get_html(utf8_encode(file_get_contents('http://www.bhaskar.com/article-ht/INT-washington-capitol-hill-shooting-suspected-woman-shot-dead-by-police-4393270-PHO。 html')));
回声 $html;

我还附上了如何显示文本的屏幕截图。在此处输入图像描述

如何以原始语言显示提取的文本?我真的很感激任何帮助。

4

1 回答 1

1

通过不添加神秘的字符串操作例程,并且还没有utf8_encodeutf8_encoded 内容:)

<?
header('Content-type: text/html; charset=utf-8');
echo file_get_contents('http://www.bhaskar.com/article-ht/INT-washington-capitol-hill-shooting-suspected-woman-shot-dead-by-police-4393270-PHO.html');
?>

在这里工作得很好,坐在丹麦,只将上面的内容粘贴到一个空的 php 文件中。

在此处输入图像描述

于 2013-10-04T08:41:17.060 回答