我正在尝试为所有 PDF 文件抓取一个网站 (obr.uk),以便我可以将它们保存到我的计算机上。为此,我目前正在使用“Outwit Docs”,这似乎不太顺利;它无法将某些页面识别为具有指向 PDF 文档的链接等。有另一种简单的(ish)解决方案吗?
我对抓取不太了解,但似乎找不到任何相当简单的解决方案。
我正在尝试为所有 PDF 文件抓取一个网站 (obr.uk),以便我可以将它们保存到我的计算机上。为此,我目前正在使用“Outwit Docs”,这似乎不太顺利;它无法将某些页面识别为具有指向 PDF 文档的链接等。有另一种简单的(ish)解决方案吗?
我对抓取不太了解,但似乎找不到任何相当简单的解决方案。
您可以使用“网站下载器”工具,例如:
并按“文件类型”pdf过滤下载
您可以在此处找到工具列表: