客人有一个网站A有一个合作伙伴计划。
合作伙伴网站B具有指向A 的链接。
我需要以一定的频率(每天两次)检查所有合作伙伴网站(5000 个网站)的所有网页,并提取从B到A 的所有链接。然后我必须用正则表达式检查 url 是否以某种方式构建。
我可以用 PHP 轻松做到这一点,但是第三方解决方案可能已经面临一些严重的挑战
- 我想利用带宽使用
- 我希望尽快完成任务
- 要检查的网页可能是业余网页充满错误和不一致的 html
- 我只想管理自上次检查后发生更改的网页
- 该过程必须自动化(cron?或替代方案?)
- ...
- (请随意扩展此列表)
但是我不想构建一个超级超级超级复杂的工具……
我仍然想要一个小巧轻便的聪明解决方案。
你将如何解决这样的任务?