php - 我可以在 PHP 中抓取网站、下载特定页面并将呈现的版本保存为 PDF 吗？

Question

我只是需要澄清一下这个概念是否可行，或者我是否误解了爬虫的能力。

假设 1 有一个包含 100 个网站/博客的列表，并且每天，我的程序（我假设它是一个爬虫的东西）将通过它们，如果有一些特定的短语匹配，如“迈阿密热火”或“勒布朗詹姆斯”，它将继续下载该页面->将其转换为带有全文/图像的pdf并保存该pdf。

所以我的问题是；

score 1 · Accepted Answer

这是完全可能的，因为您将使用 phpcrawl 来抓取网页，使用wkhtmltopdf将您的 html 转换为 pdf，因为它是

score 0 · Accepted Answer

将网站呈现为 PDF 可能是最困难的部分，它们是可以为您执行此操作的 Web 服务。

例如

（我没有隶属关系，也从未使用过它们，当我检查时它只是谷歌结果中的第一个站点）

2 回答 2