1

我不知道要研究什么或从哪里开始。

我想做的是使用 PHP 读取 HTML 页面并提取包含在 div 中的原始文本

div是这个

 <div class="thingy">
  test
 </div>

执行 php 时,我希望它回显

Test

是否有一个简单的片段,或者有人可以发布一个小脚本?

编辑:带有 Div 的 html 页面在另一个网页上。

4

3 回答 3

5

您要做的是解析 HTML。使用 PHP 附带的 DOM 模块来执行此操作:http: //php.net/manual/en/book.dom.php

您不想尝试使用正则表达式来执行此操作。

如果要从文档中删除所有 HTML 标记,请使用 PHPstrip_tags()函数:http ://us3.php.net/strip_tags

于 2012-11-24T05:18:02.200 回答
2

虽然这可以使用正则表达式来完成,但我建议使用 DOM 解析器。我的推荐去SimpleHTML Dom Parser。使用它,这就是你将如何做你想做的事

$string = "<div class=\"thingy\">test</div>";
$html = str_get_html($string); // create the DOM object
$div = $html->find('div[class=thingy]', 0); // find the first div with a class of 'thingy'
echo $div->plaintext(); // echo the text contents
于 2012-11-24T05:17:44.050 回答
0

如果你想解析你的 html,你可以像这样使用它

<?php
 $str = '<div class="thingy">test</div>';
 echo strip_tags($str);//OUTPUT : test
?>

由于您的 html 在其他网页上,因此开始输出缓冲,将该文件包含在您的主 php 脚本中,对其进行所有操作以获取内容。

于 2012-11-24T05:22:05.390 回答