-1

我使用jsoup来解析 HTML 页面,使用doc.select("tr")它时应该放置一个包含所有<tr>元素的列表。当我调查该列表的大小时,它告诉我 242。虽然当使用 Chrome 通过简单的搜索对源进行双重检查时,它得到了 264 次点击。

这使我的代码中断。似乎 jsoup 不能很好地处理很多元素。

我正在解析一个带有表格、262 * 88 个单元格和几乎一样多的帮助标签的页面。这是 jsoup 没有列表中的对象的原因吗?或者你为什么认为我有这个问题?

4

1 回答 1

0

网站可能存在差异。如果您使用桌面浏览器(例如移动设备),您通常会获得不同的视图。

你可以用 jsoup 试试这个:

  1. 设置浏览器的用户代理
  2. 打印解析后的文档 ( System.out.println(doc)) 并检查是否包含所有标签
  3. 使用其他浏览器检查网站
  4. 检查是否没有创建额外 html 的 javascript(或类似的)(jsoup 无法处理这些)
于 2013-07-30T09:26:51.553 回答