14

我很难找到如何在 Chrome 浏览器中使用命令行将页面保存为 html 或 .txt,

这是我到目前为止所做的,

C:\Users\Cipher\AppData\Local\Google\Chrome\Application>chrome.exe --new-window
http://google.com

此命令将打开 Chrome 浏览器的新窗口并访问 google.com,但我无法弄清楚如何将 google.com 保存为 html 或 txt 文件,是否可以使用命令提示符进行操作?

4

3 回答 3

12

您无法手动执行您描述的任务,但您可以使用 WebDriver 自动化执行它。

Chrome 可以使用称为WebDriver(Selenium 2 自动化套件的一部分)的 API 进行远程控制。WebDrive 具有各种编程语言的绑定,包括 JavaScript 和 Python。

这是Python的示例代码(未测试):

from selenium import webdriver

driver = webdriver.Chrome('/path/to/chromedriver')  # Optional argument, if not specified will search path.
driver.get('http://www.google.com/');
html = driver.page_source
f = open("myhtml", "wt")
f.write(html)
f.close()

原始示例

于 2013-03-26T23:13:45.857 回答
9

你真的需要打开谷歌浏览器吗?您可以使用 Wget 获取页面源(在 SuperUser 上的这篇文章中适用于 UNIX 系统或 Windows )。安装后,只需使用以下命令:

wget http://google.com -O yourfilename.html

这应该就是全部了 :) 我认为没有办法告诉 Chrome 从命令行下载 HTML :(

更新: GitHub 上有一个名为chrome-cli的存储库,允许用户从命令行控制 Chrome。缺点是它只适用于 Mac OS X。

于 2013-03-20T11:47:39.927 回答
7

我创建了一个小脚本来执行此任务:https ://github.com/abiyani/automate-save-page-as 。请参阅自述文件中的演示 gif。

它会自动执行您原本要手动保存页面的键盘操作(字面上将这些键信号发送到操作系统)。作为它在我的另一个项目中使用的副作用,它已经在各种 linux 版本上进行了测试:Ubuntu、Mint、Fedora 等 - 并且在所有这些版本上都运行良好。它可能无法在 Mac 上运行(至少在没有修改的情况下),当然也不能在 Windows 上运行。

于 2014-08-19T22:30:20.080 回答