有什么方法可以获取网站的特定标签(比如 <p>....</p>)之间的文本?
完整场景
假设我访问了一个网站 xyz.com。现在我想要我访问的网站的每个索引页面
(例如 xyz.com/abc、xyz.com/a/b 等)
,<p>...</p> 标记或第 n 个 < p>..</p> 标签被复制到一些文本文件中以供离线阅读/学习或硬拷贝。
为此,我使用 Evernote Clipper。首先安装印象笔记。它是一个记笔记的软件(超过 4000 万用户)。我个人认为这个软件很棒并且被广泛使用。然后获取浏览器扩展 Evernote Clipper。我用铬。我不确定您拥有的浏览器是否具有该扩展名,因此请检查一下。使用印象笔记剪辑器,您可以选择网页上的一个区域进行剪辑。或者您可以选择整个页面。剪辑后,它将同步到您在第一步中安装的印象笔记。之后,即使您离线,您也可以使用这些笔记。
我知道这听起来像是 Evernote 的广告,但我真的不隶属于该公司。我只是一个用户并且喜欢这个软件。到目前为止,这个软件的免费版本拥有我需要的一切,所以还没有购买高级版本。希望对你也有帮助。