最近我正在做一个项目,我需要获取任何网站的元信息、图像信息和其他 html 元素信息。
Cakephp是我使用的框架。代码非常简单,没有复杂性。因此,当用户提供一些 URL 作为输入并点击提交时。代码爬取给定的 URL 并从该页面获取必要的信息,并将包含信息的 PDF 格式的邮件发送给用户。
现在,当客户要求在后台运行相同的进程时,复杂性就来了。这是我用来在后台运行的代码..
// $this->sUrl Stores the client Input URL
// $this->noPages Stores the number of pages to be crawled from that website.
exec("wget -O - -b -q http://something.com/tools/checkerAction/". base64_encode($this->sUrl)."/$this->noPages", $var);
当在后台运行代码时一切正常,即页面正常爬行,PDF 生成健康但MAIL不工作。
为什么?是因为我在exec()中使用了 URL 路径 [http://something.com/tools/checkerAction/]吗?
我没有解决这个问题的线索。现在我只想发送我的邮件,即使进程在后台运行。任何帮助将不胜感激。
谢谢