我有一个从第三方来源一次下载数千张图像的功能。每次运行的图像数量范围为 2,500-250,000。您可以想象,这个过程需要一些时间,并且我希望尽我所能进行优化。
它的工作方式是我获取图像路径列表,循环遍历它们并从第 3 方请求图像。目前,在我发出请求之前,我会检查图像是否已经存在于服务器上……如果存在,它会跳过该图像……如果不存在,它会下载它。
我的问题是,是否有人知道下载前的检查是否会减慢进程(或可能加快进程)?下载文件并让它覆盖已经存在的图像会更有效,从而减少检查存在的步骤吗?
如果其他人有任何下载此数量图像的提示,欢迎他们!