我有一个简单的网页,我想用一个 Android 应用程序抓取。模式和正则表达式显然对推荐感到疑惑?SAX、DOM 还是 Jsoup?我正在使用的 HTML 只有 16K 的数据,所以我更喜欢最轻量的解决方案。
问问题
471 次
1 回答
1
所以,我认为这是一个非常“笼统”的问题,要给你完全正确的答案,这很难,因为每个开发人员都可以给你个人经验,但经验是非常多变的。我有经验,DOM
并且JSoup
两者都按预期工作。
DOM
如果我正在使用,我通常会使用XML
. 当我使用HTML
(有时)我正在使用JSoup
时,我可以向您推荐 JSoup。这是一个诡计。
但如果你愿意,你可以看看
HTMLCleaner
有很好的反馈- 或者你可以看看一些
open-source HTML parsers
笔记:
SAX
和之间的区别在于DOM
它在加载时SAX
解析XML
,比它更快DOM
但对应用程序有更高的要求,并且它不是XML
根据W3C
于 2013-03-29T19:19:51.973 回答