问题标签 [simple-html-dom]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
5121 浏览

php - 简单的 HTML DOM - (直接)子选择器

如何使用文本Titlea获取元素的内部文本?

我正在尝试,$html->find('#someid p > a')但它包括所有嵌套的后代a元素。

0 投票
5 回答
13674 浏览

php - php:从 html 获取纯文本 - simplehtmldom 还是 php strip_tags?

我正在寻找从 html 获取纯文本。我应该选择哪一个,php strip_tags还是simplehtmldom明文提取?

simplehtmldom 的一个优点是支持无效的 html,这本身就足够了吗?

0 投票
1 回答
817 浏览

php - php dom scraping - 获取产品价格的最佳方法

我正在使用 simpleHtmlDom 进行一些基本的屏幕抓取。不过,我在获取产品价格方面遇到了一些问题。有时我可以让它工作,有时我不能。另外,有时我会得到多个价格……例如,网站上有“通常 100 美元……现在 79.99 美元”之类的东西有什么建议吗?目前,我正在使用这个:

我不知道如何从中获取价格的一个网站是 Victoria Secret.... 价格看起来只是在随机 HTML 中浮动。

0 投票
1 回答
2134 浏览

php - PHP - 简单的 HTML Dom 解析器

我正在尝试使用 PHP Simple HTML Dom Parser 从网站中检索一些信息。在网站上有许多带有“forumborder2”类的表格,在其中我想获取一些信息。在下一个示例中,我想要图像源。

我做了以下事情:

这总是给出错误:“试图获取非对象的属性”。如果我只去$tr->children(1)->children(1)我可以得到<img src="modules/Requests/images/fPortugal.png" width=18 height=12 border=0 alt='' title=''>那么为什么我不能访问 src 属性。

0 投票
1 回答
472 浏览

php - PHP preg_match 函数:如何为 preg_match 编写真正的模式?

我试图将特定div的外部网页加载到div我的网站的特定中,所以我使用preg_match函数来获取部分代码。但我认为我写错了模式。这是我的代码:

我想在http://somthing.comtable中获取第二个的内容, 然后它没有任何结果。id=table2

0 投票
1 回答
1237 浏览

php - simplehtmldom 获取标题的href

我有一个下面的代码可以正常工作但缺少一件事。它没有返回$item['link']哪个是href标题的值。

这就是它输出的内容,因为您看到链接键是空的。我已经尝试了很多东西。大批

0 投票
2 回答
372 浏览

php - php DOM 内部标签 ( simple_html_dom )

我有这个 html: <h2><a href="http://.... > title</h2> 如何获取字符串“href”?

我试过:

错误:在非对象上调用成员函数 find()

0 投票
1 回答
438 浏览

php - 使用 simple_html_dom & cURL 但没有获得页面的所有内容。我怎样才能得到?

问题是,我得到了部分内容,但没有得到用户的评论。通过 Firebug,我看到了内容,但是当我检查源代码时,HTML 标记内没有内容/没有相同的 HTML 标记。这是我的代码:

任何人都可以帮助我 - 我应该怎么做才能获得整个页面以便我可以获取评论?enter code here

0 投票
1 回答
148 浏览

php - simplehtmldom 的解析/抓取问题

我正在尝试使用 simplehtmldom 来解析具有许多 li 标签的网页。

我只想提取<li class='ev_td_li c5'>出现在以下代码段中的特定标签的内部文本:

如果我使用以下代码,我会得到所有的“li”标签:

但是,如果我尝试按以下方式添加类,则不会得到任何输出:

我想知道“li.ev_td_li c5”中的空格字符是否是问题所在。

有谁知道我做错了什么?谢谢艾略特

0 投票
8 回答
7636 浏览

php - 使用简单的 html dom 获取页面标题?

我正在尝试使用简单的 html dom(标题标签之间的页面标题)从外部站点获取标题,但它没有检索任何内容。有任何想法吗?