8

如果这个问题以前被提出过,请原谅我。我寻找类似问题的答案,但我仍然对我的问题感到困惑。所以无论如何我都会提出这个问题。我正在使用一个名为libexif的 C 库来存储图像数据。我在我的 Linux 桌面和 MIPS 板上运行我的应用程序(它使用这个库)。对于特定的图像文件,当我尝试获取创建时间时,我得到一个错误/无效值。在进一步调试时,我发现对于这个特定的图像文件,我没有得到预期的标签(EXIF_TAG_DATE_TIME)。

这个库有几个实用功能。大多数功能的结构如下

int16_t 
exif_get_sshort (const unsigned char *buf, ExifByteOrder order)
{
    if (!buf) return 0;
        switch (order) {
        case EXIF_BYTE_ORDER_MOTOROLA:
                return ((buf[0] << 8) | buf[1]);
        case EXIF_BYTE_ORDER_INTEL:
                return ((buf[1] << 8) | buf[0]);
        }

    /* Won't be reached */
    return (0);
}

uint16_t
exif_get_short (const unsigned char *buf, ExifByteOrder order)
{
    return (exif_get_sshort (buf, order) & 0xffff);
}

当库试图调查原始数据中是否存在标签时,它会调用exif_get_short()并将返回的值分配给枚举(int)类型的变量。

在错误情况下,exif_get_short()应该返回无符号值 (34687) 返回一个负数 (-30871),这会扰乱从图像数据中提取的整个标签。

34687 超出最大可表示 int16_t 值的范围。因此导致溢出。当我对代码进行这种轻微修改时,一切似乎都正常

uint16_t
exif_get_short (const unsigned char *buf, ExifByteOrder order)
{
    int temp = (exif_get_sshort (buf, order) & 0xffff);
        return temp;
}

但是由于这是一个相当稳定的库并且已经使用了很长一段时间,它让我相信我可能在这里遗漏了一些东西。此外,这也是为其他实用程序功能构建代码的一般方式。例如:exif_get_long()调用exif_get_slong(). 然后我将不得不更改所有实用程序功能。

令我困惑的是,当我在我的 linux 桌面上为错误文件运行这段代码时,我没有发现任何问题,并且原始库代码可以正常工作。这让我相信 UINT16_MAX 和 INT16_MAX 宏在我的桌面和 MIPS 板上可能有不同的值。但不幸的是,事实并非如此。两者都在板上和桌面上打印相同的值。如果这段代码失败,它也应该在我的桌面上失败。

我在这里想念什么?任何提示将不胜感激。

编辑:调用 exif_get_short() 的代码如下所示:

ExifTag tag;
...
tag = exif_get_short (d + offset + 12 * i, data->priv->order);
switch (tag) {
...
...

ExifTag 类型如下:

typedef enum {
    EXIF_TAG_GPS_VERSION_ID             = 0x0000,
EXIF_TAG_INTEROPERABILITY_INDEX     = 0x0001,
    ...
    ...
    }ExifTag ;

正在使用的交叉编译器是 mipsisa32r2el-timesys-linux-gnu-gcc

CFLAGS        = -pipe -mips32r2 -mtune=74kc -mdspr2 -Werror -O3 -Wall -W -D_REENTRANT -fPIC $(DEFINES)

我在 Qt - Qt Media hub 中使用 libexif(实际上 libexif 与 Qt Media hub 一起提供)

EDIT2:一些额外的观察:我观察到一些奇怪的东西。我已将打印语句放入 exif_get_short() 中。就在返回之前

printf("return_value %d\n %u\n",exif_get_sshort (buf, order) & 0xffff, exif_get_sshort (buf, order) & 0xffff);
return (exif_get_sshort (buf, order) & 0xffff);

我看到以下 o/p:return_value 34665 34665

然后我还在调用 exif_get_short() 的代码中插入了打印语句

....
tag = exif_get_short (d + offset + 12 * i, data->priv->order);
printf("TAG %d %u\n",tag,tag);

我看到以下 o/p:TAG -30871 4294936425

EDIT3:在 MIPS 板上发布 exif_get_short() 和 exif_get_sshort() 的汇编代码

        .file   1 "exif-utils.c"
    .section .mdebug.abi32
    .previous
    .gnu_attribute 4, 1
    .abicalls
    .text
    .align  2
    .globl  exif_get_sshort
    .ent    exif_get_sshort
    .type   exif_get_sshort, @function
exif_get_sshort:
    .set    nomips16
    .frame  $sp,0,$31       # vars= 0, regs= 0/0, args= 0, gp= 0
    .mask   0x00000000,0
    .fmask  0x00000000,0
    .set    noreorder
    .set    nomacro

    beq $4,$0,$L2
    nop

    beq $5,$0,$L3
    nop

    li  $2,1            # 0x1
    beq $5,$2,$L8
    nop

$L2:

    j   $31
    move    $2,$0

$L3:

    lbu $2,0($4)
    lbu $3,1($4)
    sll $2,$2,8
    or  $2,$2,$3
    j   $31
    seh $2,$2

$L8:

    lbu $2,1($4)
    lbu $3,0($4)
    sll $2,$2,8
    or  $2,$2,$3
    j   $31
    seh $2,$2

    .set    macro
    .set    reorder
    .end    exif_get_sshort
    .align  2
    .globl  exif_get_short
    .ent    exif_get_short
    .type   exif_get_short, @function

exif_get_short:

    .set    nomips16
    .frame  $sp,0,$31       # vars= 0, regs= 0/0, args= 0, gp= 0
    .mask   0x00000000,0
    .fmask  0x00000000,0
    .set    noreorder
    .cpload $25
    .set    nomacro

    lw  $25,%call16(exif_get_sshort)($28)
    jr  $25
    nop

    .set    macro
    .set    reorder
    .end    exif_get_short

为了完整起见,ASM 代码取自我的 linux 机器

    .file   "exif-utils.c"
    .text
    .p2align 4,,15
    .globl  exif_get_sshort
    .type   exif_get_sshort, @function

exif_get_sshort:

.LFB1:

        .cfi_startproc
    xorl    %eax, %eax
    testq   %rdi, %rdi
    je  .L2
    testl   %esi, %esi
    jne .L8
    movzbl  (%rdi), %edx
    movzbl  1(%rdi), %eax
    sall    $8, %edx
    orl %edx, %eax
    ret
    .p2align 4,,10
    .p2align 3

.L8:
    cmpl    $1, %esi
    jne .L2
    movzbl  1(%rdi), %edx
    movzbl  (%rdi), %eax
    sall    $8, %edx
    orl %edx, %eax

.L2:
    rep
    ret
    .cfi_endproc

.LFE1:
    .size   exif_get_sshort, .-exif_get_sshort
    .p2align 4,,15
    .globl  exif_get_short
    .type   exif_get_short, @function

exif_get_short:

.LFB2:
    .cfi_startproc
    jmp exif_get_sshort@PLT
    .cfi_endproc
.LFE2:
    .size   exif_get_short, .-exif_get_short

EDIT4:希望我的最后一次更新 :-) 编译器选项设置为 -O1 的 ASM 代码

exif_get_short:

.set    nomips16
.frame  $sp,32,$31      # vars= 0, regs= 1/0, args= 16, gp= 8
.mask   0x80000000,-4
.fmask  0x00000000,0
.set    noreorder
.cpload $25
.set    nomacro

addiu   $sp,$sp,-32
sw  $31,28($sp)
.cprestore  16
lw  $25,%call16(exif_get_sshort)($28)
jalr    $25
nop

lw  $28,16($sp)
andi    $2,$2,0xffff
lw  $31,28($sp)
j   $31
addiu   $sp,$sp,32

.set    macro
.set    reorder
.end    exif_get_short
4

2 回答 2

4

MIPS 程序集显示的一件事(尽管我不是 MIPS 程序集方面的专家,所以我很有可能遗漏了某些东西或其他错误)是该exif_get_short()函数只是该函数的别名exif_get_sshort()。所做exif_get_short()的只是跳转到exif_get_sshort()函数的地址。

函数符号将exif_get_sshort()它返回的 16 位值扩展为用于返回的完整 32 位寄存器。这并没有错——这实际上可能是 MIPS ABI 指定的(我不确定)。

但是,由于exif_get_short()函数只是跳转到exif_get_sshort()函数,它没有机会清除寄存器的高 16 位。

所以当从缓冲区返回 16 位值 0x8769 时(无论是从exif_get_sshort()还是exif_get_short()),$2用于返回函数结果的寄存器包含0xffff8769,可以有以下解释:

  • 作为 32 位signed int:-30871
  • 作为 32 位 `unsigned int: 4294936425

  • 作为 16 位签名int16_t:-30871

  • 作为 16 位无符号uint16_t数:34665

如果编译器应该确保$2返回寄存器的返回类型的前 16 位设置为零uint16_t,那么它在它发出的代码中有一个错误exif_get_short()- 而不是跳转到exif_get_sshort(),它应该调用exif_get_sshort()并清除上半部分在$2返回之前。

从您看到的行为描述来看,代码调用exif_get_short()期望$2用于返回值的寄存器将清除高 16 位,以便整个 32 位寄存器可以按原样用于 16位uint16_t值。

我不确定 MIPS ABI 指定了什么(但我猜它指定$2寄存器的高 16 位应由 eb 清除exif_get_short()),但似乎存在exif_get_short()不能确保$2完全的代码生成错误在它返回之前更正或一个错误,即调用者exif_get_short()假设$2只有 16 位有效时,完整的 32 位有效。

于 2012-08-21T08:33:45.780 回答
0

这在很多层面上都被打破了,我不知道从哪里开始。看看这里做了什么:

  • 从缓冲区中读取无符号字符。
  • 它们被分配到一个已登录 int16_texif_get_sshort.
  • 这被分配给未登录 uint16_texif_get_short
  • 这最终被分配给enum类型为signed int的类型。

我会说这是一个奇迹,它完全有效。

首先,从字符到的赋值int16_t是用值完成的,而不是用表示:

return ((buf[0] << 8) | buf[1]);

当结果实际上是否定的时,这已经将您带入了未定义行为的陷阱。另外,它仅在实现的签名 int 表示与文件格式中使用的表示相同时才有效(我猜是二进制补码)。它会因为一个人的补码和符号大小而失败。因此,请检查 MIPS 实施的情况。

干净的方法是相反的:将缓冲区中的两个字符分配给一个uint16_t,这将是定义明确的操作,并使用它返回一个int16_t。然后,如有必要,您可以关注不同表示的值的进一步更正。

此外,这里:

if (!buf) return 0;

0 是一个非常糟糕的返回值选择,因为它是一个有效的枚举常量:

EXIF_TAG_GPS_VERSION_ID             = 0x0000,

如果预计这是无效的默认值,则应返回常量,而不是幻数。虽然这似乎是一个返回 的通用函数int16_t,但这里应该使用其他一些错误机制。

对于您的具体问题,请遵循您的 MIPS 实现上的有符号和无符号之间的转换流程,包括完成的默认提升,并检查所有中间值以找到它中断的点。您的 MIPS 使用 32 位整数,而不是 16 位,对吗?检查 INT_MAX 和 UINT_MAX。

于 2012-08-20T07:30:34.010 回答