3

我正在用 Python 开发一个网页抓取工具,我需要熟悉某些网站上各种 HTML 标签的功能。不幸的是,Chrome、Firefox 和 Safari 提供的“查看源代码”不能输出格式非常好的 HTML 源代码——它往往会在同一行放置大量标签。浏览器是否提供任何可以清理一些东西的插件,或者我是否需要在 Python 中获取/开发某种工具,将脏 HTML 作为输入并输出格式清晰的 HTML?

4

2 回答 2

2

因为我主要使用 Chrome,所以我能想到的最好的例子是Code Formatter (Chrome)

这不是自动的;您必须将整个页面复制并粘贴到应用程序中。应用程序窗口也很小(据我所知,这是不可改变的),但相对有效。

...以及 JavaScript 和 CSS 美化器

更有效和更干净,但正如标题所示,仅适用于 .Js 和 CSS。

于 2016-11-19T18:27:18.753 回答
0

使用 Firefox,您可以选择(突出显示 - 我也在为初学者编写)文本,一旦被选中,释放鼠标左键并在选定区域内单击鼠标右键,然后选择“查看选择源”。然后,您可以复制突出显示的文本并将其粘贴。

我的复合示例: 查看选择源

于 2021-12-22T20:29:46.850 回答