8

在 C 中,代码

char *c = "Hello world!";

存储Hello world!\0在rodata中并c使用指向它的指针进行初始化。我怎么能用字符串以外的东西来做到这一点?

具体来说,我正在尝试定义自己的字符串类型

typedef struct {
   size_t Length;
   char Data[];
} PascalString;

然后想要某种宏,这样我就可以说

const PascalString *c2 = PASCAL_STRING_CONSTANT("Hello world!");

并让它表现相同,因为\x0c\0\0\0Hello world!它存储在rodata中并c2用指向它的指针进行初始化。

我尝试使用

#define PASCAL_STRING_CONSTANT(c_string_constant) \
    &((const PascalString) { \
        .Length=sizeof(c_string_constant)-1, \
        .Data=(c_string_constant), \
    })

正如这些 问题中所建议的那样,但它不起作用,因为它Data是一个灵活的数组:我得到了错误error: non-static initialization of a flexible array member(使用 gcc,clang 给出了类似的错误)。

这在C中可能吗?如果是这样,PASCAL_STRING_CONSTANT宏会是什么样子?

澄清

对于 C 字符串,以下代码块永远不会将字符串存储在堆栈中:

#include <inttypes.h>
#include <stdio.h>

int main(void) {
    const char *c = "Hello world!";

    printf("test %s", c);

    return 0;
}

正如我们通过查看程序集所看到的,第 5 行编译为仅将指针加载到寄存器中。

我希望能够使用 pascal 字符串获得相同的行为,并且可以使用 GNU 扩展。以下代码也从不将帕斯卡字符串存储在堆栈中:

#include <inttypes.h>
#include <stdio.h>

typedef struct {
   size_t Length;
   char Data[];
} PascalString;

#define PASCAL_STRING_CONSTANT(c_string_constant) ({\
        static const PascalString _tmpstr = { \
            .Length=sizeof(c_string_constant)-1, \
            .Data=c_string_constant, \
        }; \
        &_tmpstr; \
    })

int main(void) {
    const PascalString *c2 = PASCAL_STRING_CONSTANT("Hello world!");

    printf("test %.*s", c2->Length, c2->Data);

    return 0;
}

查看其生成的程序集,第 18 行也只是加载了一个指针。

但是,我发现在 ANSI C 中执行此操作的最佳代码会生成将整个字符串复制到堆栈的代码:

#include <inttypes.h>
#include <stdio.h>

typedef struct {
   size_t Length;
   char Data[];
} PascalString;

#define PASCAL_STRING_CONSTANT(initial_value) \
    (const PascalString *)&(const struct { \
        uint32_t Length; \
        char Data[sizeof(initial_value)]; \
    }){ \
        .Length = sizeof(initial_value)-1, \
        .Data = initial_value, \
    }

int main(void) {
    const PascalString *c2 = PASCAL_STRING_CONSTANT("Hello world!");

    printf("test %.*s", c2->Length, c2->Data);

    return 0;
}

为此代码生成的程序集中,第 19 行将整个结构复制到堆栈上,然后生成指向它的指针。

我正在寻找生成与我的第二个示例相同的程序集的 ANSI C 代码,或者解释为什么 ANSI C 不可能。

4

3 回答 3

1

这可以通过statment-expressions GNU 扩展来完成,尽管它是非标准的。

#define PASCAL_STRING_CONSTANT(c_string_constant) ({\
        static const PascalString _tmpstr = { \
            .Length=sizeof(c_string_constant)-1, \
            .Data=c_string_constant, \
        }; \
        &_tmpstr; \
    })

该扩展允许您在一个块中包含多个语句作为表达式,通过将块括在({ ... }). 因此,我们可以将 our 声明PascalString为一个static const值,然后返回一个指向它的指针。

为了完整起见,如果我们想修改它,我们也可以创建一个堆栈缓冲区:

#define PASCAL_STRING_STACKBUF(initial_value, capacity) \
    (PascalString *)&(struct { \
        uint32_t Length; \
        char Data[capacity]; \
    }){ \
        .Length = sizeof(initial_value)-1, \
        .Data = initial_value, \
    }
于 2019-09-26T18:21:53.887 回答
1

您可以使用此宏,它在其内容上命名变量的名称:

#define PASCAL_STRING(name, str) \
    struct { \
        unsigned char len; \
        char content[sizeof(str) - 1]; \
    } name = { sizeof(str) - 1, str }

创建这样的字符串。像这样使用它:

const PASCAL_STRING(c2, "Hello world!");
于 2019-09-26T18:30:35.050 回答
-2

我不确定你为什么要这样做,但你可以这样做。此方法会将您的字符串存储在数据段中,并为您提供一种将其作为结构访问的方法。请注意,我创建了一个打包结构以确保映射到该结构中始终有效,因为我基本上已经在下面的 const 表达式中对数据字段进行了硬编码。

#include <stdio.h>

#pragma packed(1)
typedef struct {
   unsigned char Length;
   char Data[];
} PascalString;
#pragma pack()

const unsigned char HELLO[7] = { 
0x06,
'H','E','L','L','O','\0'
};


int main(void) {
        PascalString *  myString = (PascalString *)HELLO;
        printf("I say: %s \n", myString->Data);
}
于 2019-10-15T01:02:14.630 回答