8

我正在使用 Jsoup.parse() 的所有 String 版本:

parse(String html, String baseUri)

排除连接速度以对其性能进行基准测试。

在典型的低端 Android 手机Jsoup.parse()上,调用一个不太罕见的长维基百科页面 (~600KB) 的 html 字符串需要9 秒

我的客户不愿意接受这种延迟,我正在考虑将 Jsoup 转储到不同的引擎,自己解析网页(仍然使用 Java),或者在 NDK 中使用一些 C/C++ 解析器(如果可用)。

但我更喜欢尽可能继续使用 Jsoup。

有没有办法加快速度Jsoup.parse()

4

1 回答 1

6

我尝试用大页面自己做的事情(如果可能并且您只想要页面上的一些信息)是尝试最小化文本以解析先前识别您想要的区域,然后使用 JSoup 解析想要的区域。

这样你就可以在 Java 中结合你自己的解析来减少数据,然后使用 JSoup 作为商品。

于 2012-07-14T11:04:07.433 回答