2

我正在将应用程序从 32 位移植到 64 位。
尽管它是 C++,但它是 C 风格的编码(遗留产品)。我有一个问题,联合和结构的组合用于存储值。这里使用了一个名为“Any”的自定义数据类型,它应该保存任何基本数据类型的数据。Any 的实现如下:

typedef struct typedvalue
{
long data; // to hold all other types of 4 bytes or less
short id; // this tells what type "data" is holding
short sign; // this differentiates the double value from the rest
}typedvalue;

typedef union Any 
{
double any_any;
double any_double; // to hold double value
typedvalue any_typedvalue;
}Any;

联合的大小为 8 个字节。他们使用了 union,因此在给定的时间只有一个值,并且他们使用了 struct 来区分类型。您可以在任何给定时间存储 double、long、string、char、float 和 int 值。这就是想法。如果它是双精度值,则该值存储在 any_double 中。如果它是任何其他类型,则它存储在“数据”中,值的类型存储在“id”中。“符号”将告诉值“任何”是否持有双精度或其他类型。代码中大量使用 any_any 来复制地址空间中的值,而与类型无关。(这是我们最大的问题,因为我们不知道在特定时间它会持有什么!)

如果假设它是一个字符串或指针“Any”,则它存储在“data”(它的类型为long)中。在 64 位中,这就是问题所在。指针为 8 个字节。所以我们需要将“long”改为等效的 8 字节(long long)。但这会将联合的大小增加到 16 个字节,并且“any_any”的自由使用会导致问题。“any_any”的用法太多了,你永远不确定它可以容纳什么。

我已经尝试了这些步骤,但结果不成功:
1. 将结构中的“长数据”更改为“长长数据”,这将使联合的大小变为 16 个字节。- 这将不允许数据作为“any_any”(8 个字节)传递。
2. 将结构声明为联合内部的指针。并将struct内部的“long data”更改为“long long data”。- 这里遇到的问题是,因为它是一个指针,我们需要为结构分配内存。“any_any”的自由使用使我们难以分配内存。有时我们可能会覆盖内存并因此擦除该值。
3. 创建一个单独的集合来保存“数据”的值(一个键值对)。- 这行不通,因为这个实现是应用程序的核心,集合会遇到数百万个数据。

有人可以帮我吗?

4

3 回答 3

1

“谁能帮帮我”这听起来像是绝望的呼喊,我完全理解。

编写此代码的人完全不尊重未来的验证或可移植性,现在你要付出代价。

(让这对任何说“但我们的平台是 32 位的!我们永远不会使用 64 位的!”的人来说是一个教训)

我知道你会说“但代码库太大”,但最好还是重写产品。并且这次做的正确!

于 2011-06-15T08:57:04.927 回答
1

忽略原始设计疯狂的事实,您可以使用<stdint.h>(或很快<cstdint>获得一点可预测性:

struct typedvalue
{
  uint16_t id;
  uint16_t sign;
  uint32_t data;
};

union any
{
  char any_raw[8];
  double any_double
  typedvalue any_typedvalue;
};

你仍然不能保证它typedvalue会被紧密打包,因为非char成员没有对齐保证。如果你必须的话,你可以用你的方式来打一个struct Foo { char x[8]; };双关语,但这也太难看了。*(uint32_t*)(&Foo.x[0])*(uint16_t*)(&Foo.x[4])

如果你在 C++0x 中,我肯定会在某处为sizeof(typedvalue) == sizeof(double).

于 2011-06-15T09:05:33.170 回答
0

如果您需要存储 8 字节指针“类型”字段,那么您别无选择,只能使用至少 9 个字节,并且在 64 位系统对齐上可能会将其填充到 16 个字节。

您的数据结构应类似于

typedef struct {
    union {
        void   *any_pointer;
        double  any_double;
        long    any_long;
        int     any_int;
    } any;
    char        my_type;
} any;

如果使用 C++0x,请考虑对字段使用强类型枚举。my_type在早期版本中,所需的存储空间enum取决于实现,并且可能超过一个字节。

为了节省内存,您可以使用(特定于编译器的)指令来请求数据结构的最佳打包,但由此产生的未对齐的内存访问可能会导致性能问题。

于 2011-06-15T13:44:26.950 回答