问题标签 [hpple]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
81 浏览

iphone - HPple 无法识别标签

您好,我使用这是我当前的路径

当我尝试将其更改为

或者

代码输出 Nodes 为 nil

0 投票
1 回答
102 浏览

iphone - 如何在整个 XML 文档中获取具有特定名称的第 n 个元素?

使用 Hpple Xpath 的类似工作也会如此

html 树中的第四个标签?还是我需要通过在 for() 循环中计数来以编程方式完成它?

0 投票
1 回答
127 浏览

xpath - tesseract hocr 输出的 Hpple XPath 查询问题

我有以下 html 片段

我希望 xpath 查询字符串能够提取 bbox 字符串和单词 1-4 的节点内容。我遇到了麻烦,因为单词嵌套在<em>s 和<strong>s 中,也可能是空的!谢谢。

0 投票
1 回答
613 浏览

ios - hpple xpath 问题

我正在使用 hpple 解析 HTML 文档。我遵循了 Ray Wenderlich 的教程,并让他们的示例文件一切正常。但是,我需要对其进行一些更改,以便为我的朋友博客读取某个 HTML 文件。该文件比我迄今为止使用的示例更复杂。文件的相关部分(完整上传的要点是:

文件中有几个这样的部分,我需要将所有

(title="StampNation LIVE 撤退更新") 在一个数组中。我已成功放置

使用 XPathQuery 放入一个数组中//div[@class = 'entry-content']/p。但是,如果没有由于空数组而导致代码崩溃,我似乎无法获得标题。显然我的 XPathQuery 不正确。这是我尝试过的。

以及一系列其他尝试!

有人对我有什么建议吗?我查看了许多 SO 答案,以及 hpple 附带的示例,但我无法将它们拼凑在一起。

更新:在 Jens 的帮助下,我将查询更改为
NSString *postsXpathQueryString = @"//h2[@class = 'entry-title']/a";

这给了我一个数组,但我现在也得到了这个错误。

2013-04-08 10:26:30.604 HTML[12408:11303] * 由于未捕获的异常“NSRangeException”而终止应用程序,原因:“* -[__NSArrayM objectAtIndex:]:索引 4 超出范围 [0 .. 3]” * First throw call stack: (0x210a012 0x1203e7e 0x20ac0b4 0x3852 0x2028fb 0x2029cf 0x1eb1bb 0x1fbb4b 0x1982dd 0x12176b0 0x2706fc0 0x26fb33c 0x2706eaf 0x2372bd 0x17fb56 0x17e66f 0x17e589 0x17d7e4 0x17d61e 0x17e3d9 0x1812d2 0x22b99c 0x178574 0x17876f 0x178905 0x9733ab6 0x181917 0x14596c 0x14694b 0x157cb5 0x158beb 0x14a698 0x2065df9 0x2065ad0 0x207fbf5 0x207f962 0x20b0bb6 0x20aff44 0x20afe1b 0x14617a 0x147ffc 0x1d2d 0x1c55) libc++abi.dylib:终止调用抛出异常

更新 2

通过在我重新加载数据时放入 if 语句来修复错误索引超出范围。我在我的 NSLog 中得到一个数组,但它没有把它放在我的表格视图中。表格视图出现空!!但不会再崩溃了!!!

最后更新

它现在可以工作了,Jens 帮我正确查询了查询,然后我只需要填写表格视图。我将数组计数设置为 20,因为 Ray 的 tut 有无数个条目。我朋友的博客,只有四个!感谢所有的帮助。

0 投票
1 回答
192 浏览

ios - 访问 HTML 5 播放器 - iOS SDK

我正在使用 Hpple 从网页获取链接并遇到问题。因为 iOS 不支持 flash,所以我必须使用 HTML 5 播放器。我想要做的是访问播放器。如果网站加载,而用户没有 Flash,则可以选择使用 HTML 5 播放器观看视频。这就是 HTML 的样子。

我想知道的是如何使用 iOS SDK 访问 HTML 播放器?我一直在努力。

0 投票
2 回答
217 浏览

cocoa-touch - 使用 Hpple 解析 HTML

我正在使用 Hpple 传递 HTML 文件。HTML 文件与以下内容非常相似。

我想看到的结果是“这里有一些文本,这里有另一个文本 Blah”(忽略所有内容是标题 div 并包括内部和之后的内容)

以下是我尝试过的一些查询:

  1. "//div[@class='entry']/p" 结果:"some text here"
  2. "//div[@class='entry']//p" 结果:"some text here caption here Blah"
  3. "//div[@class='entry']/p//text()" 结果:Nothing

谢谢。

0 投票
1 回答
286 浏览

html - hpple XpathQuery 的想法?

我正在使用 hpple 来解析一些 HTML。我正在使用 Xcode 4.6 和 iOS 6.1。它看起来像这样。

我的 HTML

我可以使用以下内容提取文本和图像XPathQueryStrings

文字 ==>//div[@class = 'entry-content']/p

图片 ==>//div[@class = 'entry-content']//img/@src

但是,我还需要在“Retiring Stamp Set PDF”底部附近获取文本。此文本会更改,但格式通常相同。我尝试了以下路径,

div[@class = 'entry-content']//a[@title]//text()

但这没有用。我将所有这些都放在一个数组中,我可以看到该条目的返回值为空,但我想获取文本。我查看了 XPath 语法,但无法进一步了解。有没有人有什么建议?

0 投票
1 回答
1145 浏览

html - Objective-C HTML parsing. Get all text between tags

0 投票
1 回答
133 浏览

ios - 抓住标签的第一个孩子?

目前,我正在关注 Ray Wenderlich 的关于在 ios 上解析 html的教程。根据这棵树,一切都得到了完美的解释:

在此处输入图像描述
(来源:raywenderlich.com

他们为每个教程提取标题和 url 标签。

这就是他们创建一个数组来保存他们的教程对象的方式:

现在这是我的问题。我目前正在我的网站上尝试这个。问题是我不知道如何获得每个<tr>标签的第四个孩子。

这是我的html树。

在此处输入图像描述

我试图只从每个标签中获取第四个孩子。但我不知道如何处理它。

这是正确的吗?

0 投票
2 回答
480 浏览

html - 查找表中几行的 XPath?

我目前正在尝试使用 xpath 查询从 html 站点中提取特定数据,但在提取特定部分时遇到问题。

使用//div[@id='main']/h2我的 xpath 查询,我可以使用以下内容提取“查看当前”文本:

但是,我还想引入以下内容:

到目前为止,我已经得到了这个://div[@id='main']/table[@class='bodytext']/tr但这就是我卡住的地方。任何帮助将不胜感激!谢谢!

这是我试图抓取的 html: