3

给定具有标准布局成员的标准布局类,例如:

struct foo {
    int n;
    int m;
    unsigned char garbage;
};

n根据标准,写入结构的最后一个字节而不写入和m(但可能写入)的内存区域是否总是安全的garbage?例如,

foo f;
*(static_cast<unsigned char *>(static_cast<void *>(&f)) + (sizeof(foo) - 1u)) = 0u;

在花了一些时间阅读 C++11 标准之后,在我看来答案可能是肯定的。

从 9.2/15 开始:

分配具有相同访问控制(第 11 条)的(非联合)类的非静态数据成员,以便后面的成员在类对象中具有更高的地址。未指定具有不同访问控制的非静态数据成员的分配顺序 (11)。实现对齐要求可能会导致两个相邻的成员不会被立即分配;管理虚拟功能 (10.3) 和虚拟基类 (10.1) 的空间要求也是如此。

因此,该garbage成员具有比其他两个成员更高的地址(它们本身是连续存储的,因为它们具有标准布局),因此结构的最后一个字节必须属于garbage或属于最终填充的一部分。

这个推理正确吗?我在这里干涉了f对象的生命周期吗?写入填充字节有问题吗?

编辑

作为对评论的回复,我在这里尝试实现的目标与我正在编写的类似变体的类有关。

如果以直接的方式进行(即,在变体类中放置一个 int 成员来记录正在存储的类型),填充将使类比它需要的大几乎 50%。

我要做的是确保我要存储在变体中的每个类类型的每个最后一个字节都是可写的,所以我可以将存储标志合并到我正在使用的原始存储(对齐的原始字符数组)中变体。在我的具体情况下,这消除了大部分浪费的空间。

编辑 2

作为一个实际示例,考虑将这两个类存储在典型 64 位机器上的变体中:

// Small dynamic vector class storing 8-bit integers.
class first {
    std::int8_t    *m_ptr;
    unsigned short m_size_capacity; // Size and capacity packed into a single ushort.
};

// Vector class with static storage.
class second {
    std::int8_t  m_data[15];
    std::uint8_t m_size;
};

class variant
{
    char m_data[...] // Properly sized and aligned for first and second.
    bool m_flag; // Flag to signal which class is being stored.
};

这两个类的大小在我的机器上是 16,变体类中需要的额外成员使大小变为 24。如果我现在在最后添加垃圾字节:

// Small dynamic vector class storing 8-bit integers.
class first {
    std::int8_t    *m_ptr;
    unsigned short m_size_capacity; // Size and capacity packed into a single ushort.
    unsigned char  m_garbage;
};

// Vector class with static storage.
class second {
    std::int8_t    m_data[14]; // Note I lost a vector element here.
    std::uint8_t   m_size;
    unsigned char  m_garbage;
};

两个类的大小仍然是 16,但是如果现在我可以自由使用每个类的最后一个字节,我可以取消变体中的标志成员,最终大小仍然是 16。

4

3 回答 3

9

Instead, you should put the tag first, followed by the other small members.

// Small dynamic vector class storing 8-bit integers.
struct first
{
    unsigned char  m_tag;
    std::uint8_t   m_size;
    std::uint8_t   m_capacity;
    std::int8_t    *m_ptr;
};

// Vector class with static storage.
struct second
{
    unsigned char  m_tag;
    std::uint8_t   m_size;
    std::int8_t    m_data[14];
};

Then, the language rules allow you to put these into a union and use either one to access m_tag, even if that wasn't the "active" member of the union, because the initial layout is the same (special rule for common initial sequence of members).

union tight_vector
{
     first dynamic;
     second small_opt;
};

tight_vector v;
if (v.dynamic.m_size < 4) throw std::exception("Not enough data");
if (v.dynamic.m_tag == DYNAMIC) { /* use v.dynamic */ }
else { /* use v.small_opt */ }

The rule in question is 9.2/18:

If a standard-layout union contains two or more standard-layout structs that share a common initial sequence, and if the standard-layout union object currently contains one of these standard-layout structs, it is permitted to inspect the common initial part of any of them. Two standard-layout structs share a common initial sequence if corresponding members have layout-compatible types and either neither member is a bit-field or both are bit-fields with the same width for a sequence of one or more initial members.

于 2013-09-02T01:54:35.807 回答
1

是的,在 C++ 中,包括类在内的任何对象都表示为一系列可寻址char对象(“字节”),并且在类中按顺序声明而没有干预访问说明符的对象具有顺序升序的地址。因此 storage forgarbage必须具有char *nor更高的地址(当寻址为 时) m

理论上,编译器可以在对象的末尾存储一个基类,或者类似 vtable 指针的东西,但实际上为了简单起见,这些东西总是放在开头。我不确定标准对标准布局类的大小有什么保证,这与是否可以添加填充有关,这将对实现是否可以出于某种目的依赖填充的存在产生影响,但它可能归结为允许使用恰好存在的填充的实现,但它不能添加任何内容(并且访问可能并不简单或高效)。

我要做的是确保我要存储在变体中的每个类类型的每个最后一个字节都是可写的

这与使用garbage会员本身有何不同?如果你知道它在那里,大概你可以简单地访问它。

于 2013-09-02T01:47:26.177 回答
0

struct 的最后一个字节不会是 n 和 m 的一部分,但是你怎么知道编译器没有在最后一个字节中存储其他内容,例如类型信息?

我不记得保证任何此类事情的标准。只有 sizeof(T) into 和 out 的 memcpy 会产生相同的值,这并不意味着最后一个字节不包含信息。

于 2013-09-02T01:46:21.180 回答