问题标签 [simple-html-dom]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
730 浏览

php - xampp 的 simplehtmldom 用法

各位程序员,您好,我正在尝试一个新的网络抓取项目,并选择了 simplehtmldom 来完成它,我正在使用 xampp 在 localhost 上测试该项目。但我不知道将提取的 simplehtmldom 的 zip 文件放在 xampp 文件夹中的位置。是否有特定的放置位置,或者我应该将它放在任何地方并在源代码中给出地址?

0 投票
1 回答
1463 浏览

simple-html-dom - simplehtmldom 500 错误

我看到有很多关于 simplehtmldom 的主题,但似乎没有人的问题是我的 - 具体来说,它只有 500 个,即使在提供的示例上也是如此。我发现我可以在没有错误的情况下包含该文件,但如果我尝试使用 file_get_html,它会是 500 秒。我在手册中发现的关于安装的唯一内容是 allow_fopen_url 可能存在问题,我就是这样做的。

我错过了什么?

0 投票
1 回答
2192 浏览

php - 如何用简单的 HTML DOM 抓取它

我正在尝试使用简单的 html dom 从看起来像这样的文件中提取元素。

  • 该文件有几个看起来相同的表class=sometable
  • 每张桌子都有几张<tr class=sometr>
  • 然后在每个 tr 中,我有th一个标题,一个 td 有一个类别。

我要提取的是所有表中所有表行的所有标题class=title及其对应的类别编号。class=category我已将文件加载到$html. 有人能告诉我在那之后我应该找到什么吗?我什至尝试过$collection = $html->find('tr');并且对集合做了一个vardump,但什么也没得到,所以看起来我选择不正确。

0 投票
1 回答
805 浏览

php - 多个 simple_html_dom() 对象创建

我正在使用 php 简单的 html dom 库创建一个网络爬虫。我正在做一个网络抓取项目,在一个 php 页面上我加载一个 html 页面进行抓取,并在其中调用另一个 php 页面上的函数,该页面也加载一个或多个 html 页面。问题是我无法加载第二个 html 页面。以下是我在两个页面上使用的用于加载 html 页面进行抓取的功能。第一页

第一页

当代码调用第二个 php 页面时,出现以下错误

0 投票
1 回答
1494 浏览

php - 简单的 HTML DOM 仅获得 1 个元素

我在这里关注 NetTuts 的一个简化版的抓取教程,它基本上可以找到所有 divclass=preview

http://net.tutsplus.com/tutorials/php/html-parsing-and-screen-scraping-with-the-simple-html-dom-library/comment-page-1/#comments

这是我的代码。问题是当我数数时$items我只得到 1,所以它只得到第一个 div class=preview,而不是全部。

0 投票
1 回答
2399 浏览

php - PHP 简单的 HTML DOM 解析器死了

我是使用简单 HTML DOM 解析器的带有一堆子页面的屏幕抓取页面。出于某种原因,它可以很好地解析前 40 个子页面,但是当涉及到第 41 个子页面时,它会毫无错误地死掉。

我已经制作了这个测试页面,并尝试记录我在脚本中所做的所有事情以及 Simple HTML DOM Parser 中的一些 venets,但我无法找到错误。

有谁知道为什么在解析 41 号 URL 时会这样?或者有人知道一些简单的 HTML DOM 解析器会失败的情况吗?

我的测试页面:http ://snuzzer.dk/pub/shdp/parse.php

这是我的脚本,我使用 Simple HTML DOM Parser 的未修改版本。有趣的事情发生在 get_lections() 中,我标记了我称之为 Simple HTML DOM Parser 的地方。

0 投票
1 回答
747 浏览

php - Kohana 和 Simple HTML Dom 解析器有问题

尝试在我的应用程序中使用 Simple HTML Dom Parser。

将 scraping_slashdot() 的示例函数放入控制器中。

得到:

问题是,当我在独立文件中(不是作为 Ko 应用程序的一部分)执行完全相同的操作时,一切似乎都运行良好。

有谁知道它可能是什么?

附言

使用 Ko 3.2,没有尝试过其他版本,虽然我之前在 3.0 中使用过这个类就好了。

0 投票
2 回答
11214 浏览

httpwebrequest - 如何解决 HTTP/1.1 400 错误请求

全部,

我正在使用 php 中的 simple_html_dom 通过命令提示符访问网页

其中 $url 是网络 URL。如果您的 URL 类似于http://abc.com/xyz.html?s= "sometext" 那么我得到了正确的响应。但是,如果 URL 在 get 参数(如http://abc.com/xyz.html?s=“some text”)中有空格,我会收到 HTTP/1.1 400 Bad Request 。

谁能帮我解决这个问题。

提前致谢。

0 投票
1 回答
746 浏览

php - 使用 PHP Simple HTML Dom 解析器遍历表行直到已知元素

好的,我正在尝试使用PHP Simple HTML DOM Parser从这个 HTML 表构建一个 xml 提要。

我的目标是提取日期,然后提取以下行直到下一个日期。这样我就可以为每个日期构建一个 XML 节点。

我目前拥有 html 中的每个日期并构建了它们各自的 xml 节点

在下一个比赛日之前,我将如何获取每个固定装置的球队名称等?

0 投票
1 回答
3861 浏览

php - PHP HTML DOM Parser 从 img 标签中选择 alt

我正在尝试使用简单的 php html dom 解析器仅从 img 标记中提取 alt 值。我似乎无法让它仅仅拉动 alt 标签。这是我正在使用的:

如果我使用它,它可以工作并提取整个图像标签:

但我真正想要的只是 alt 标签中的信息。

我正在尝试从亚马逊报价列表页面的 html 中提取:http: //www.amazon.com/gp/offer-listing/B001H8QHG0

有什么建议么?

谢谢您的帮助!