问题标签 [simpledom]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
31 浏览

web-scraping - 通过使用简单的 dom 解析器向其他网站发送输入来获取数据

如何使用 Simple Dom Parser 通过 POST 方法将输入值发送到某个网站来获取响应数据?例如,下面是 URL,我想将一个数据发布到这个 URL,我希望响应数据作为我的文件中的输出。

0 投票
2 回答
93 浏览

javascript - 我无法在搜索页面中获取特定 URL

我进入房地产网站并按城市名称搜索。之后,我想获取大阪市建筑 URL。在这里http://brillia.com/search/?area=27999 有四个。 

我正在使用该链接来获取 URL。

但我不能抓住那些。其实我抓的不只是大阪市页面的URL,实际上都抓到了。当我尝试查看大阪页面站点的源代码时。它表明http://brillia.com/search/这就是为什么我要抓住所有其他链接......

但是我怎样才能在这里只抓取 URL ->http://brillia.com/search/?area=27999

任何想法?谢谢你。

0 投票
2 回答
921 浏览

php - Simple_Dom 错误:file_get_contents():流不支持在 Laravel 中查找

我收到如下错误。

file_get_contents():流不支持查找

我由作曲家安装了 simple_dom:

并使用了这个:

这是我的代码:

但我遇到了一个错误。任何想法?感谢您的帮助!

0 投票
2 回答
1762 浏览

php - 循环遍历 html 表并使用简单的 dom 解析器在 php 中获取 tr、th 和 td

我需要用简单的 html dom 解析器获取一个表,清理它(删除 attr 和空格),然后再次输出。

我的问题是,我如何使用 PHP 循环并以一个顺序输出 TH 和 TD?目前它会将 TH 作为 TD 处理,但我喜欢正确设置 TH。

我用foreach尝试了一些东西,但我想我需要别的东西。

你的想法。

问候;s

0 投票
1 回答
51 浏览

php - 如何随机化 file_get_html 的用户代理?

我正在用 simple_html_dom 抓取一个网站(没有什么狡猾的),需要随机化我的用户代理。

尝试了多个数组内容,但继续获得第一个。

0 投票
0 回答
66 浏览

php - PHP 从另一个 URL、空白页或 E_NOTICE 抓取信息:类型 8 -- 试图获取非对象的属性

基本上我正在尝试为我的网站制作一个小型跟踪插件,但我不确定我要为元素 ID 设置正确的名称。我得到一个空白屏幕或 E_NOTICE :类型 8 - 试图获取非对象的属性

我只想显示这个

https://puu.sh/EItml/34bdb97863.png

这是我第一次尝试...

第二个

我确实做了一些研究,但我不确定我需要放什么,对不起,如果这是浪费时间,我只是 PHP 的新手......

这是它在 URL 上的位置

https://puu.sh/EItlK/671f9877ed.png

https://puu.sh/EIt9C/be30180469.png

蒂亚:)

0 投票
1 回答
63 浏览

php - 如何使用 php simple dom 抓取无效的 html?

我正在尝试使用 phpsimpledom 抓取网页。

我尽我所能从每个标签中获取文本,class="u"但它不起作用,因为</div> 第一个标签上缺少结束标签<div class="u">。任何人都可以帮我解决这个问题......

0 投票
0 回答
9 浏览

web-scraping - SImpledom PHP 拖欠返空的网站

我已经做了很多为项目抓取一些数据的实例,我正在为 WP 添加一个插件以将卡片添加到 woocommerce 商店,并希望从 TCGplayer.com 获取 MTG 卡片的基本数据。不尝试抓取大量页面,只需要输入网址中的基本卡数据和价格信息。使用 curl 我返回标题数据但没有内容。在 chrome 中我看不到任何 curl 不会检索的浏览器加载活动。

URL 我已尝试收集数据

https://www.tcgplayer.com/product/240037/?Language=English

对此有任何想法表示赞赏。