我不知道要研究什么或从哪里开始。
我想做的是使用 PHP 读取 HTML 页面并提取包含在 div 中的原始文本
div是这个
<div class="thingy">
test
</div>
执行 php 时,我希望它回显
Test
是否有一个简单的片段,或者有人可以发布一个小脚本?
编辑:带有 Div 的 html 页面在另一个网页上。
我不知道要研究什么或从哪里开始。
我想做的是使用 PHP 读取 HTML 页面并提取包含在 div 中的原始文本
div是这个
<div class="thingy">
test
</div>
执行 php 时,我希望它回显
Test
是否有一个简单的片段,或者有人可以发布一个小脚本?
编辑:带有 Div 的 html 页面在另一个网页上。
您要做的是解析 HTML。使用 PHP 附带的 DOM 模块来执行此操作:http: //php.net/manual/en/book.dom.php
您不想尝试使用正则表达式来执行此操作。
如果要从文档中删除所有 HTML 标记,请使用 PHPstrip_tags()
函数:http ://us3.php.net/strip_tags
虽然这可以使用正则表达式来完成,但我建议使用 DOM 解析器。我的推荐去SimpleHTML Dom Parser。使用它,这就是你将如何做你想做的事
$string = "<div class=\"thingy\">test</div>";
$html = str_get_html($string); // create the DOM object
$div = $html->find('div[class=thingy]', 0); // find the first div with a class of 'thingy'
echo $div->plaintext(); // echo the text contents
如果你想解析你的 html,你可以像这样使用它
<?php
$str = '<div class="thingy">test</div>';
echo strip_tags($str);//OUTPUT : test
?>
由于您的 html 在其他网页上,因此开始输出缓冲,将该文件包含在您的主 php 脚本中,对其进行所有操作以获取内容。