问题标签 [querypath]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 如何在 QueryPath 中选择这些未分类的元素
这是有问题的HTML:
我的第一个直觉是在 li 元素上使用 eq(0) 和 eq(1),但有时联系人或位置可能不存在并且 li 的顺序会改变。我也尝试使用 filterPreg() 来选择“联系人:”和“位置:”文本,但这似乎没有按我的预期工作。
缺少使用find('.logo-wrapper')->text()
然后使用标准正则表达式来获得我需要的东西,有没有办法将它保存在 QueryPath 中?
php - 使用 find 获取 QueryPath 中的第一个 HTML 元素
我正在尝试使用 QueryPath 从 HTML 代码中检索一个特定元素。它发生了两次,但我只想要第一个。搜索对象确实有效,但它返回了两个元素。我试图在我的搜索中添加一个伪类选择器,但这没有用。
这是代码中出现两次的 HTML 元素:
这就是我搜索它的方式:
输出为“of 5 of 5”,即两个元素紧挨着打印。如何修改我的搜索以使我只有“5 个”?
php - QueryPath (PHP) 和元标记
有没有人有任何关于如何使用 QueryPath 抓取元标记的示例?我正在尝试获取以下内容:
<meta content="London" property="og:locality">
我最近从 simple_html_dom 切换,它易于使用,有据可查但速度很慢。相比之下,QueryPath 更快,但在 Google / SO 上有废话文档和很少的问题。
php - 为什么我的 QueryPath 脚本会导致“从空值创建默认对象”错误?
我正在尝试抓取一个网站以使用QueryPath进行一些练习。
这是我到目前为止所拥有的,并给了我一个错误:
从空值创建默认对象
代码:
如果我取消注释img
或is_unique
数组行中的任何一个,就会发生错误。
当这些行被注释掉时,其他一切都有效并给出预期的输出。
php - 使用 Querypath 直接访问一个 ID
嗨,我很惊讶的非常基本的问题在这里还没有被问到。
是否可以使用 Querypath 直接获取基于 id 的元素?
目前,我这样做的方式是
然而,这似乎不是最有效的方法,因为它每次都循环遍历每个图像,而它只能直接访问 ID。
php - 如何在dom中的2个不同标签之间选择文本?
我有一个<p>
标签,其中包含由标签分隔的文本,<br>
如下所示:
我要选择的元素在第一个<br>
标签之后直到最后,我目前正在使用QueryPath库,我只获取 html 标签和它们之间的文本,而没有获取其他未被标签包围的文本.
例如,我只得到<br>
标签和<em></em>
带有此代码的标签:
所以我尝试获取整个<p>
标签并尝试从<small>
标签中删除元素,直到第一个<br>
标签:
QueryPath 库是Dom本机扩展之上的一个包装器,因此任何使用 Dom 扩展的解决方案都可以工作。
php - QueryPath:包含选择器
QueryPath 在下面的代码中让我很难使用 Contains 选择器。我所看到的一切看起来都是正确的。
这是我的 HTML
php - QueryPath selector fails with chained :has():contains()
The following CSS selector works in jQuery so I was expecting it to work in QueryPath 3.0.0, but it only returns an empty value:
#xA;Here is what I am trying to get it to retrieve:
#xA;What is wrong with the selector?
php - QueryPath 用其中的 HTML 字符串打破脚本标签
想知道是否有其他人遇到过这个问题,以及他们是否找到了解决方案。
htmlqp()
我有一个使用 QueryPath 的方法解析网页(我无法控制)的应用程序。
我遇到的问题是,每当解析的页面碰巧有一个<script>
带有一些 javacript 的内联标签,其中也引用了某种 HTML 字符串时,QueryPath 的writeHTML()
方法会尝试“修复”HTML通过在 javascript 中添加换行符、关闭标签和其他废话,这反过来会破坏页面上的所有 javascript(在某些情况下,HTML)。
例如:
-变成-
显然,后者明显破裂。
有谁知道如何阻止 QueryPath 这样做?或者也许让它忽略<script>
一般标签正文中的内容?
谢谢。
xpath - XPath 正在返回包含标签的元素
我正在使用 xPath 读取 XML 文件,但是当尝试获取某个元素的内容时,它会返回它,包括标签 <> 。
XML 文件的结构如下:
我在 //item 的上下文中工作,然后使用 attribute04//category 来获取类别元素。但是,这就是我要回来的:
它返回包括标签在内的整个元素。有人知道这里出了什么问题吗?
我正在为 Drupal ( https://drupal.org/project/feeds_xpathparser ) 使用 Feeds xPath 解析器模块。
先感谢您。