1

在经历了很多挫折之后,我需要一些帮助来获得适用于 Android 的 HTML 解析器。

我基本上需要一个解析器来登录网站并检索主页,该主页大量使用 javascript 和 ajax 来呈现数据。从那里我需要能够访问与锚标签链接的其他页面。再次强调页面上的 Ajax 和 javascript,所有的数据都是通过这些手段创建的。

编辑:经过一些研究,看起来我需要一个与 Android 兼容的无头浏览器。

起初我尝试使用 JSoup,它只检索没有写入 javascript 和 ajax 数据的页面。除非我在这里理解错误,否则 JSoup 不适合这种情况。

我也尝试过 HtmlUnit,它运行良好,但由于已知的 jar 冲突和“无法转换为 dalivik”错误,我无法在 android 中启动并运行它。

如果有人知道另一个合适的 HTML 解析器,或者可以帮助我让 JSoup 和 ajax 页面运行良好,或者知道如何让 HtmlUnit 在 android 上运行,我将永远欠你的债。

我已经用 JSoup 和 HtmlUnit 度过了一周的大部分时间,并且基本上已经回到了第一方。沮丧已经开始,我完全不知道该怎么做。

同样,我需要一个 HTML 解析器,它允许在我解析之前加载 Ajax 和 Javascript,并且它需要是 android 友好的!

谢谢!

4

1 回答 1

0

您可以尝试拦截各个 Ajax 通信。它们要么是获取通信,要么是发布通信。你可以用JSoup一一调用。对于少量的 Ajax 调用来说是可行的。事实上,这种方式在 Android 上解析的数据更少,并且可以更快地解析。

于 2013-10-17T08:24:48.243 回答