0

尝试从 DOM 解析 HTML 数据,当我使用 Chrome 的开发者工具时,我可以在控制台中看到该数据。当我在本地将页面保存为 HTML 并搜索目标数据时,找不到它。我已经阅读了一些关于静态 HTML 文件是如何被浏览器接收的,以及 Javascript 将如何以不同方式呈现它以进行演示的阅读。

具体示例:谷歌“nba”,结果在页面顶部包含一个表格,其中嵌套了当天的所有预定比赛<tbody>,如果您保存此页面,则 HTML 文件不包含<tbody>标签。尝试使用 BeautifulSoup4 和 Python 解析这个游戏表。

4

1 回答 1

1

要完全以编程方式执行此操作,您需要运行一个无头浏览器——它可以像您的真实浏览器一样执行 JavaScript。Ghost.py可以使这更容易。

否则,您可以按照 millimoose 的建议进行操作,并使用浏览器的内置开发人员工具将当前 DOM 状态保存为 HTML。

于 2012-12-16T01:37:04.993 回答