问题标签 [simple-html-dom]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 创建嵌套来自 simple_html_dom.php 的结构
好的,所以我使用http://simplehtmldom.sourceforge.net/上的基于 php 的 simple_html_dom.php 来抓取网页,我想做的是生成一个嵌套列表,它反映了 html 元素结构页。最终,我计划使用该列表初始化 jsTree,但我无法通过第一步。我知道有一个简单直接的解决方案,但我似乎无法弄清楚。我花了几个小时在网上搜索,最后才在这里发帖。
本质上我想转换它:
进入这个:
我认为正确的一个例子是这样,但它会生成:`
编码:
php - 用php解析html页面
今天,当我使用 Simple HTML DOM 解析器解析一页时,我没有得到任何结果。所以我想,这一定很奇怪。所以我去看了那里写的 HTML 代码。我发现有很多错误。
所以问题来了。当解析器正常工作,但 HTML 是一团糟时,在状态下做什么。也许有人会建议一些方法或其他一些能够处理的解析器,这很重要。
谢谢大家的帮助。
php - 通过每个元素的两个或多个属性使用简单的 html dom 解析器查找部分
我想说,我知道,很多人认为,简单的 HTML DOM 解析器对于 HTML 解析器来说是一个非常糟糕的选择。我现在仍然需要使用它。
我阅读了一些文章,其中描述了如何通过每个元素的两个或多个属性进行搜索。他们提出了类似的东西和阵列过滤的一种可能性
我的问题是关于通过两个属性查找部分的原生可能性。我没有在手册中找到它,但并非所有内容都始终在手册中。
有谁知道有这样的方式或类似的方式tag2[attr1=value,attr2=value]
吗tag2[attr1=value attr2=value]
?
php - 使用`simple html dom`获取网站图片时如何过滤广告图片
我想simple_html_dom
用来获取一些网站的图像。这是一个测试站点。当我使用下面的一些基本代码时,我可以获得所有图像。但是如何过滤广告图片?
我注意到一些广告也是jpg image format
,但 url 包含ad
or ads
,或者只是gif image format
...如何编写一些代码来过滤广告?谢谢。
php - 如何使用 SimpleHTMLDom 获取绝对图像 URI
我simple_html_dom
用来获取网站的图像。但有时,图像的链接没有以完整的域 URI 为前缀,例如http://example.com
. 它们看起来像
- 图片/_home-ss-21.jpg
- /_home-ss-22b.jpg
- ./_1249a7s.png 或
- ../../../a19489s_20110412.jpeg。
如何将这些 URI 转换为绝对 URI,包括协议和域信息。
php - 获得最大的图像
我正在做一个图像搜索项目,我想获得一页最大的图像。我添加了一些代码来修复图像的真实地址,删除可能是广告的图像。比较那里的宽度*高度回显出最大的一个。但我的代码有一些问题。这是我的整个代码。谁能帮我修复哪里出错以及如何优化代码,我感觉这个过程很痛苦。谢谢大家。
url_to_absolute.php
php - HTML DOM Parser 无法获取 JavaScript 倒计时
我正在使用来自http://simplehtmldom.sourceforge.net/的 HTML DOM Parser
然后我遇到了无法从源链接中的倒计时 JavaScript 获取文本的问题。
源代码:(这是Countdown JavaScript)
我的代码:
然后输出:(带冒号的空格)
php - 使用 simple_html_dom 解析 ul
我想在这个 ul 中获取每个跨度的内部文本。
我现在有这个,但我想这样做而不为每个跨度编写相同的代码。
php - 解析来自移动网站的评论 html
试图用 simple_html_dom 解析这个 html,但其中大部分都被注释了我该如何解决这个问题?(这是一个移动页面)。
……
php - PHP Simple HTML DOM,注意:试图获取非对象的属性
我正在Notice: Trying to get property of non-object
:
$article 是一个simple_html_dom()
对象。