我正在编写一个脚本来下载我的所有图像,计算 MD5 哈希,然后将该哈希存储在数据库的新列中。我有一个脚本,可以从数据库中选择图像并将它们保存在本地。图像的唯一 ID 成为文件名。
我的问题是,虽然cURLQueue非常适合快速下载许多文件,但在回调中计算每个文件的 MD5 哈希会减慢下载速度。那是我的第一次尝试。对于我的下一次尝试,我想将我的代码的下载和散列部分分开。做这个的最好方式是什么?我更喜欢使用 PHP,因为这是我最熟悉的,也是我们的服务器运行的,但是 PHP 的线程支持至少可以说是缺乏的。
想法是有一个建立 SQLite 连接的父进程,然后产生许多选择图像的子进程,计算它的哈希值,将其存储在数据库中,然后删除图像。我走在正确的道路上吗?