4

当我搜索“JPEG”和“元数据”这两个词时,我有很多答案来操纵元数据......而这与我想要的相反......;o)

我编写了一个完全符合我要求的函数...(如果图像相似,并且只有元数据发生变化,则函数返回True;如果至少一个像素发生变化,则返回False)但是,我想改进表现...

瓶颈是bmp.Assign(jpg);

function CompareImages(fnFrom, fnTo: TFileName): Boolean;
var
  j1, j2: TJpegImage;
  b1, b2: TBitmap;
  s1, s2: TMemoryStream;
begin
  Result := False;
sw1.Start;
  j1 := TJpegImage.Create;
  j2 := TJpegImage.Create;
sw1.Stop;
sw2.Start;
  s1 := TMemoryStream.Create;
  s2 := TMemoryStream.Create;
sw2.Stop;
//sw3.Start;
  b1 := TBitmap.Create;
  b2 := TBitmap.Create;
//sw3.Stop;
  try
  sw1.Start;
    j1.LoadFromFile(fnFrom);
    j2.LoadFromFile(fnTo);
  sw1.Stop;

            // the very long part...
            sw3.Start;
              b1.Assign(j1);
              b2.Assign(j2);
            sw3.Stop;


  sw4.Start;
    b1.SaveToStream(s1);
    b2.SaveToStream(s2);
  sw4.Stop;
  sw2.Start;
    s1.Position := 0;
    s2.Position := 0;
  sw2.Stop;
  sw5.Start;
    Result := IsIdenticalStreams(s1, s2);
  sw5.Stop;
  finally
//  sw3.Start;
    b1.Free;
    b2.Free;
//  sw3.Stop;
  sw2.Start;
    s1.Free;
    s2.Free;
  sw2.Stop;
  sw1.Start;
    j1.Free;
    j2.Free;
  sw1.Stop;
  end;
end;

sw1, ..., sw5 是TStopWatch,我用来识别花费的时间。

IsIdenticalStreams 来自这里

如果我直接比较TJpegImage,流是不同的......

有更好的编码方式吗?

问候,

W。

更新:

测试从评论中提取的一些解决方案,我与此代码具有相同的性能:

type
  TMyJpeg = class(TJPEGImage)
    public
      function Equals(Graphic: TGraphic): Boolean; override;
  end;

...

function CompareImages(fnFrom, fnTo: TFileName): Boolean;
var
  j1, j2: TMyJpeg;
begin
  sw1.Start;
  Result := False;
  j1 := TMyJpeg.Create;
  j2 := TMyJpeg.Create;
  try
    j1.LoadFromFile(fnFrom);
    j2.LoadFromFile(fnTo);
  Result := j1.Bitmap.Equals(j2.Bitmap);
  finally
    j1.Free;
    j2.Free;
  end;
  sw1.Stop;
end;

有什么方法可以在不进行位图转换的情况下直接访问文件中的像素数据字节(跳过元数据字节)?

4

1 回答 1

7

JPEG 文件由块组成,其类型由标记标识。chunks的结构(除了独立的SOI、EOI、RSTn):

chunk type marker (big-endian FFxx)
chunk length (big-endian word)
data (length-2 bytes)

编辑: SOS 块受另一个标记的限制,而不是长度。

元数据块以 APPn 标记 (FFEn) 开头,但带有 JFIF 标题的 APP0 (FFE0) 标记除外。

所以我们可以只读取和比较重要的块,而忽略 APPn 块和 COM 块(正如 TLama 所注意到的)。

示例:一些 jpeg 文件的十六进制视图: 在此处输入图像描述

它以 SOI(图像开始)标记 FFD8(独立,无长度)开头,

然后是长度为 16 字节的 APP0 块 (FFE0),

然后是 APP1 块 (FFE1),其中包含元数据(EXIF 数据、NIKON COOLPIX 名称等),因此我们可以忽略 9053 字节(23 5D)并检查地址 2373 处的下一个块标记,依此类推...

编辑:简单的解析示例:

var
  jp: TMemoryStream;
  Marker, Len: Word;
  Position: Integer;
  PBA: PByteArray;

  procedure ReadLenAndMovePosition;
  begin
    Inc(Position, 2);
    Len := Swap(PWord(@PBA[Position])^);
    Inc(Position, Len);
  end;

begin
  jp := TMemoryStream.Create;
  jp.LoadFromFile('D:\3.jpg');
  Position := 0;
  PBA := jp.Memory;

  while (Position < jp.Size - 1) do begin
    Marker := Swap(PWord(@PBA[Position])^);
    case Marker of
      $FFD8: begin
          Memo1.Lines.Add('Start Of Image');
          Inc(Position, 2);
        end;
      $FFD9: begin
          Memo1.Lines.Add('End Of Image');
          Inc(Position, 2);
        end;
      $FFE0: begin
          ReadLenAndMovePosition;
          Memo1.Lines.Add(Format('JFIF Header Len: %d', [Len]));
        end;
      $FFE1..$FFEF, $FFFE: begin
          ReadLenAndMovePosition;
          Memo1.Lines.Add(Format('APPn or COM Len: %d Ignored', [Len]));
        end;
      $FFDA: begin
          //SOS marker, data stream, ended by another marker except for RSTn
          Memo1.Lines.Add(Format('SOS data stream started at %d', [Position]));
          Inc(Position, 2);
          while Position < jp.Size - 1 do begin
            if PBA[Position] = $FF then
              if not (PBA[Position + 1] in [0, $D0..$D7]) then begin
                Inc(Position, 2);
                Memo1.Lines.Add(Format('SOS data stream ended at %d',
                  [Position]));
                Break;
              end;
            Inc(Position);
          end;
        end;
    else begin
        ReadLenAndMovePosition;
        Memo1.Lines.Add(Format('Marker %x Len: %d Significant', [Marker, Len]));
      end;
    end;
  end;
  jp.Free;
end;
于 2012-05-12T04:06:05.060 回答