1

作为我的网络应用程序的一部分,我构建了一个系统,该系统会定期提取 RSS 提要并抓取其内容。我还查找提要项中存在的任何图像标签,并尝试将其拉出以查询其大小等以确定要使用的“图片”。

这是该部分代码的粗略草图:

  1. <image>节点吗?如果是这样,那就是图像。出口。
  2. 通过simplehtmldom解析description节点的内容并查找任何和所有标签img
  3. 遍历所有img标签:
    • getimagesize();
    • 如果图像尺寸大于我之前找到的尺寸,请使用这张图片。
  4. 出口。

在第 3 步,脚本可能需要一段时间,特别是对于有大量图像供我检查的提要。我假设每次调用 getimagesize() 都需要一定的时间,而且加起来很快。我不太担心它会花费很长时间(尽管如果可以减少它,那将是最好的),但事实上,当这个脚本运行时,它实际上让所有其他并发用户挂起,直到脚本完成。

我想避免这种情况,但不太精通服务器管理 - 也许有人可以给我一些指导?

谢谢!

4

1 回答 1

1

如果您需要性能提升,请在单独的服务器上运行它。getimagesize()真的可以减慢速度。我建议在它自己的服务器上运行抓取脚本,并在您当前的服务器上托管其他所有内容。

于 2012-07-06T20:27:06.430 回答