在 C 中,代码
char *c = "Hello world!";
存储Hello world!\0
在rodata中并c
使用指向它的指针进行初始化。我怎么能用字符串以外的东西来做到这一点?
具体来说,我正在尝试定义自己的字符串类型
typedef struct {
size_t Length;
char Data[];
} PascalString;
然后想要某种宏,这样我就可以说
const PascalString *c2 = PASCAL_STRING_CONSTANT("Hello world!");
并让它表现相同,因为\x0c\0\0\0Hello world!
它存储在rodata中并c2
用指向它的指针进行初始化。
我尝试使用
#define PASCAL_STRING_CONSTANT(c_string_constant) \
&((const PascalString) { \
.Length=sizeof(c_string_constant)-1, \
.Data=(c_string_constant), \
})
正如这些 问题中所建议的那样,但它不起作用,因为它Data
是一个灵活的数组:我得到了错误error: non-static initialization of a flexible array member
(使用 gcc,clang 给出了类似的错误)。
这在C中可能吗?如果是这样,PASCAL_STRING_CONSTANT
宏会是什么样子?
澄清
对于 C 字符串,以下代码块永远不会将字符串存储在堆栈中:
#include <inttypes.h>
#include <stdio.h>
int main(void) {
const char *c = "Hello world!";
printf("test %s", c);
return 0;
}
正如我们通过查看程序集所看到的,第 5 行编译为仅将指针加载到寄存器中。
我希望能够使用 pascal 字符串获得相同的行为,并且可以使用 GNU 扩展。以下代码也从不将帕斯卡字符串存储在堆栈中:
#include <inttypes.h>
#include <stdio.h>
typedef struct {
size_t Length;
char Data[];
} PascalString;
#define PASCAL_STRING_CONSTANT(c_string_constant) ({\
static const PascalString _tmpstr = { \
.Length=sizeof(c_string_constant)-1, \
.Data=c_string_constant, \
}; \
&_tmpstr; \
})
int main(void) {
const PascalString *c2 = PASCAL_STRING_CONSTANT("Hello world!");
printf("test %.*s", c2->Length, c2->Data);
return 0;
}
查看其生成的程序集,第 18 行也只是加载了一个指针。
但是,我发现在 ANSI C 中执行此操作的最佳代码会生成将整个字符串复制到堆栈的代码:
#include <inttypes.h>
#include <stdio.h>
typedef struct {
size_t Length;
char Data[];
} PascalString;
#define PASCAL_STRING_CONSTANT(initial_value) \
(const PascalString *)&(const struct { \
uint32_t Length; \
char Data[sizeof(initial_value)]; \
}){ \
.Length = sizeof(initial_value)-1, \
.Data = initial_value, \
}
int main(void) {
const PascalString *c2 = PASCAL_STRING_CONSTANT("Hello world!");
printf("test %.*s", c2->Length, c2->Data);
return 0;
}
在为此代码生成的程序集中,第 19 行将整个结构复制到堆栈上,然后生成指向它的指针。
我正在寻找生成与我的第二个示例相同的程序集的 ANSI C 代码,或者解释为什么 ANSI C 不可能。