1

我正在使用元数据提取器来编写一个组织图像和查找重复项的 Java 应用程序。API 很棒,但有些东西我想不通。

假设我有两张 JPG 图片。这些图像在视觉上是完全相同的(即像素相同)。但是,封装在文件中的元数据中的某些内容可能有所不同。

如果我计算每个完整文件的 MD5 哈希值,我将得到两个不同的哈希值。但是,我只想计算图像/像素数据的哈希值,这将为两个文件产生相同的哈希值。

那么 - 有没有办法使用元数据提取器从 JPG 中提取原始图像/像素数据,以便我可以计算我的哈希值?

此外,Javadoc 是否可用于此 API?我似乎找不到它。

4

1 回答 1

2

您可以使用库的JpegSegmentReader类来实现这一点。它可以让您提取包含图像数据的 JPEG 片段并忽略元数据片段。

我在另一个答案中讨论了这种技术,提问者表示他们用这种方法取得了成功。

这实际上会为库创建一个很好的示例应用程序。如果您想出一些东西并想分享,请这样做。

于 2017-01-31T22:22:02.453 回答