问题标签 [querypath]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 在目标 Web 服务器上使用 Php/Querypath 爬虫的已知或预期影响是什么,如何将其保持在最低限度?
我正在构建一个 php+querypath 爬虫来原型化一个想法。我担心一旦我运行它,目标站点可能会受到某种程度的影响,因为它有大量我要抓取的相关页面——目前有 1361 个页面。
有哪些建议可以将对目标站点的影响降至最低?
php - QueryPath 或 DOMDocument 用于编辑大型 XML 文件?
我正在尝试使用 PHP 编辑一个大型 XML 文件(从 Excel .xlsm 文件中提取),我想知道哪个是最好的(关于性能):QueryPath 还是 PHP 的 DOMDocument?
该文件的大小至少为 8 MB,并且包含大约 400k 行(格式化时)。
感谢您的反馈
php - 关于查询路径的 2 个基本问题
如何查找节点是否不存在?我在用
if ($item->branch()->siblings($tagNames['desc'])->text())
有没有更好的办法 ?
- 有没有办法执行 OR 查询?如果标签 A 存在获取它的 text(),否则获取 B 的 text()?
我正在使用以下内容:
这看起来不是最有效的做事方式。
谢谢
php - 使用 php 和 querypath 更改属性
我想使用 PHP & QueryPath 来查找文档中的所有图像,然后src
像这样修改它:
我想改变
到
我可以使用找到特定的类名
现在,当我想找到所有img
内容以更改src
:
但是当我执行
我只看到最后一张图片。哪里有问题?
php - 使用 QueryPath 查找和替换
我有一个分配给 $output 变量的字符串。我想使用 QueryPath 遍历字符串并向每个匹配的元素添加一个类。
目前我有:
$output = qp($output)->find('table')->addclass('table')->html();
唯一的问题是它在第一次匹配之前删除了 $output 的内容。有没有办法使用 QueryPath 来查找匹配项,然后添加类,同时保持 $output 的内容不变?
编辑:
attr - 如何使用 QueryPath 按属性查找元素
我需要找到所有表width=230
到目前为止,我有:
但我得到一个"Call to undefined method DOMElement::attr()"
错误。
php - 在 QueryPath 和 HTML 中使用 utf-8 字符
我正在尝试使用 QueryPath 在 PHP 中操作 HTML。它工作正常,直到某些 utf-8 字符与 ->html() 和 ->text() 方法一起使用。即使使用 html-characters 也不能解决问题。
有问题的例子:
我尝试了多种组合都没有成功。
如果我注释掉第二行并取消注释第三行,我会收到以下警告: 警告:DOMDocumentFragment::appendXML(): Entity: line 1: parser error : Entity 'aring' not defined in D:\Inetpub\wwwroot\QueryPath- 2.1.2-minimal\QueryPath.php 在第 1208 行警告:DOMDocumentFragment::appendXML(): å 在 D:\Inetpub\wwwroot\QueryPath-2.1.2-minimal\QueryPath.php 在第 1208 行警告:DOMDocumentFragment::appendXML (): ^ 在 D:\Inetpub\wwwroot\QueryPath-2.1.2-minimal\QueryPath.php 1208 行
php - 从 var_dump 获取数据
我var_dump
正在给我:
我怎么拉["textContent"]
?
我当前的索引页面是: