不同之处在于 UIImagePNGRepresentation() 仅返回图像数据并忽略文件头。
问题是您可能从偏移量 0 开始。这将读取文件头,这会弄乱您的散列(因为它们可能是相同的图像但具有不同的创建日期)。
相反,这是一个从文件中间读取 1K 的示例。对于图像,这只会读取大约 340 像素,因此如果您要比较图像是否有重复,您可能希望将比较大小增加到大约 20K 或更大。
代码将是这样的:
#import <CommonCrypto/CommonCrypto.h>
#define HASH_DATA_SIZE 1024 // Read 1K of data to be hashed
...
ALAssetRepresentation *rep = [anAsset defaultRepresentation];
Byte *buffer = (Byte *) malloc(rep.size);
long long offset = rep.size / 2; // begin from the middle of the file
NSUInteger buffered = [rep getBytes:buffer fromOffset:offset length:HASH_DATA_SIZE error:nil];
if (buffered > 0)
{
NSData *data = [NSData dataWithBytesNoCopy:buffer length:buffered freeWhenDone:YES]
unsigned char result[CC_MD5_DIGEST_LENGTH];
CC_MD5([data bytes], [data length], result);
NSString *hash = [NSString stringWithFormat:
@"%02X%02X%02X%02X%02X%02X%02X%02X%02X%02X%02X%02X%02X%02X%02X%02X",
result[0], result[1], result[2], result[3],
result[4], result[5], result[6], result[7],
result[8], result[9], result[10], result[11],
result[12], result[13], result[14], result[15]
];
NSLog(@"Hash for image is %@", hash);
}
我尝试了大约 4000 张照片。使用 UIImagePNGRepresentation() 时整个图像的平均散列时间为 0.008 秒,而当比较从文件中间读取的每个图像的 1K 时,它下降到大约 0.00008 秒。