我想打开一个网页(其 URL 作为命令行参数给出),然后想将该网页的内容保存为 .txt 文件。
请记住,我需要 .txt 文件而不是网页的来源。
我用硒尝试了我的手,效果很好。但是现在我想要一些不打开真正浏览器的东西,因为打开浏览器并在其中加载页面是一项耗时的任务。
我想用java来做。
内容是指我们在 IE 中保存网页时获得的文本(不带标记),方法是转到“另存为”,然后选择“.txt”作为文件的输出格式。
我想打开一个网页(其 URL 作为命令行参数给出),然后想将该网页的内容保存为 .txt 文件。
请记住,我需要 .txt 文件而不是网页的来源。
我用硒尝试了我的手,效果很好。但是现在我想要一些不打开真正浏览器的东西,因为打开浏览器并在其中加载页面是一项耗时的任务。
我想用java来做。
内容是指我们在 IE 中保存网页时获得的文本(不带标记),方法是转到“另存为”,然后选择“.txt”作为文件的输出格式。
嗯,我什至会从头开始编写代码,看起来并不复杂,甚至可能不值得在您的项目中添加对另一个库的依赖: