作为我的网络应用程序的一部分,我构建了一个系统,该系统会定期提取 RSS 提要并抓取其内容。我还查找提要项中存在的任何图像标签,并尝试将其拉出以查询其大小等以确定要使用的“图片”。
这是该部分代码的粗略草图:
- 有
<image>
节点吗?如果是这样,那就是图像。出口。 - 通过simplehtmldom解析
description
节点的内容并查找任何和所有标签img
- 遍历所有
img
标签:getimagesize();
- 如果图像尺寸大于我之前找到的尺寸,请使用这张图片。
- 出口。
在第 3 步,脚本可能需要一段时间,特别是对于有大量图像供我检查的提要。我假设每次调用 getimagesize() 都需要一定的时间,而且加起来很快。我不太担心它会花费很长时间(尽管如果可以减少它,那将是最好的),但事实上,当这个脚本运行时,它实际上让所有其他并发用户挂起,直到脚本完成。
我想避免这种情况,但不太精通服务器管理 - 也许有人可以给我一些指导?
谢谢!