0

我有一个看起来像这样的 .html 文件:

<html>
<body>
<pre style="word-wrap: break-word; white-space: pre-wrap;">{blah blah blah text that I want extracted} </pre>
</body>
</html>

我想制作一个 PHP 脚本,从<pre>标签中提取内部文本。我已经尝试过简单的 HTML DOM,但它没有做任何事情,它只是没有回应。我不确定我在这里做错了什么,或者我是否应该使用简单的 HTML Dom。这是我的 PHP 脚本代码,用于从 html 文件中提取文本:

<?php
include 'simple_html_dom.php';
// Create DOM from URL or file
$html = file_get_html('http://data.mtgox.com/api/2/BTCUSD/money/ticker');

// Find all images
foreach($html->find('img') as $element)
       echo $element->src . '<br>';

// Find all links
foreach($html->find('pre') as $element)
       echo $element . '<br>';
?>

关于为什么它不起作用的任何想法?

4

2 回答 2

2

工作 DOMDOcument 示例

$doc = new DOMDocument();
$doc->loadXML('<html><body><pre style="word-wrap: break-word; white-space: pre-wrap;">{blah blah     blah text that I want extracted} </pre></body></html>');
$pres = $doc->getElementsByTagName('pre');
foreach($pres as $v){
   echo $v->firstChild->wholeText.'<br />';
}
于 2013-03-29T16:54:27.613 回答
0

您正在获取的 URL 返回 JSON,而不是 HTML。

使用json 解析器来处理它。

于 2013-03-29T16:57:49.760 回答