问题标签 [simple-html-dom]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - xampp 的 simplehtmldom 用法
各位程序员,您好,我正在尝试一个新的网络抓取项目,并选择了 simplehtmldom 来完成它,我正在使用 xampp 在 localhost 上测试该项目。但我不知道将提取的 simplehtmldom 的 zip 文件放在 xampp 文件夹中的位置。是否有特定的放置位置,或者我应该将它放在任何地方并在源代码中给出地址?
simple-html-dom - simplehtmldom 500 错误
我看到有很多关于 simplehtmldom 的主题,但似乎没有人的问题是我的 - 具体来说,它只有 500 个,即使在提供的示例上也是如此。我发现我可以在没有错误的情况下包含该文件,但如果我尝试使用 file_get_html,它会是 500 秒。我在手册中发现的关于安装的唯一内容是 allow_fopen_url 可能存在问题,我就是这样做的。
我错过了什么?
php - 如何用简单的 HTML DOM 抓取它
我正在尝试使用简单的 html dom 从看起来像这样的文件中提取元素。
- 该文件有几个看起来相同的表
class=sometable
。 - 每张桌子都有几张
<tr class=sometr>
。 - 然后在每个 tr 中,我有
th
一个标题,一个 td 有一个类别。
我要提取的是所有表中所有表行的所有标题class=title
及其对应的类别编号。class=category
我已将文件加载到$html
. 有人能告诉我在那之后我应该找到什么吗?我什至尝试过$collection = $html->find('tr');
并且对集合做了一个vardump,但什么也没得到,所以看起来我选择不正确。
php - 多个 simple_html_dom() 对象创建
我正在使用 php 简单的 html dom 库创建一个网络爬虫。我正在做一个网络抓取项目,在一个 php 页面上我加载一个 html 页面进行抓取,并在其中调用另一个 php 页面上的函数,该页面也加载一个或多个 html 页面。问题是我无法加载第二个 html 页面。以下是我在两个页面上使用的用于加载 html 页面进行抓取的功能。第一页
第一页
当代码调用第二个 php 页面时,出现以下错误
php - 简单的 HTML DOM 仅获得 1 个元素
我在这里关注 NetTuts 的一个简化版的抓取教程,它基本上可以找到所有 divclass=preview
这是我的代码。问题是当我数数时$items
我只得到 1,所以它只得到第一个 div class=preview
,而不是全部。
php - PHP 简单的 HTML DOM 解析器死了
我是使用简单 HTML DOM 解析器的带有一堆子页面的屏幕抓取页面。出于某种原因,它可以很好地解析前 40 个子页面,但是当涉及到第 41 个子页面时,它会毫无错误地死掉。
我已经制作了这个测试页面,并尝试记录我在脚本中所做的所有事情以及 Simple HTML DOM Parser 中的一些 venets,但我无法找到错误。
有谁知道为什么在解析 41 号 URL 时会这样?或者有人知道一些简单的 HTML DOM 解析器会失败的情况吗?
我的测试页面:http ://snuzzer.dk/pub/shdp/parse.php
这是我的脚本,我使用 Simple HTML DOM Parser 的未修改版本。有趣的事情发生在 get_lections() 中,我标记了我称之为 Simple HTML DOM Parser 的地方。
php - Kohana 和 Simple HTML Dom 解析器有问题
尝试在我的应用程序中使用 Simple HTML Dom Parser。
将 scraping_slashdot() 的示例函数放入控制器中。
得到:
问题是,当我在独立文件中(不是作为 Ko 应用程序的一部分)执行完全相同的操作时,一切似乎都运行良好。
有谁知道它可能是什么?
附言
使用 Ko 3.2,没有尝试过其他版本,虽然我之前在 3.0 中使用过这个类就好了。
httpwebrequest - 如何解决 HTTP/1.1 400 错误请求
全部,
我正在使用 php 中的 simple_html_dom 通过命令提示符访问网页
其中 $url 是网络 URL。如果您的 URL 类似于http://abc.com/xyz.html?s= "sometext" 那么我得到了正确的响应。但是,如果 URL 在 get 参数(如http://abc.com/xyz.html?s=“some text”)中有空格,我会收到 HTTP/1.1 400 Bad Request 。
谁能帮我解决这个问题。
提前致谢。
php - 使用 PHP Simple HTML Dom 解析器遍历表行直到已知元素
好的,我正在尝试使用PHP Simple HTML DOM Parser从这个 HTML 表构建一个 xml 提要。
我的目标是提取日期,然后提取以下行直到下一个日期。这样我就可以为每个日期构建一个 XML 节点。
我目前拥有 html 中的每个日期并构建了它们各自的 xml 节点
在下一个比赛日之前,我将如何获取每个固定装置的球队名称等?
php - PHP HTML DOM Parser 从 img 标签中选择 alt
我正在尝试使用简单的 php html dom 解析器仅从 img 标记中提取 alt 值。我似乎无法让它仅仅拉动 alt 标签。这是我正在使用的:
如果我使用它,它可以工作并提取整个图像标签:
但我真正想要的只是 alt 标签中的信息。
我正在尝试从亚马逊报价列表页面的 html 中提取:http: //www.amazon.com/gp/offer-listing/B001H8QHG0
有什么建议么?
谢谢您的帮助!