0

试图清理一些代码,我想知道以下是否是将 uint16_t 转换为 wchar_t 的安全方法。

#if ! defined(MARKUP_SIZEOFWCHAR)
#if __SIZEOF_WCHAR_T__ == 4 || __WCHAR_MAX__ > 0x10000
#define MARKUP_SIZEOFWCHAR 4
#else
#define MARKUP_SIZEOFWCHAR 2
#endif

void FileReader::parseBuffer(char * buffer, int length)
{
  //start by looking for a vrsn
  //Header seek around for a vrns followed by 32 bit size descriptor
  //read 32 bits at a time
  int cursor = 0;
  char vrsn[5] = "vrsn";
  cursor = this->searchForMarker(cursor, length, vrsn, buffer);
  int32_t size = this->getObjectSizeForMarker(cursor, length, buffer);
  cursor = cursor + 7; //advance cursor past marker and size
  wchar_t *version = this->getObjectForSizeAndCursor(size, cursor, buffer);
  wcout << version;
  delete[] version; //this pointer is dest from getObjectForSizeAndCursor
}

-

wchar_t* FileReader::getObjectForSizeAndCursor(int32_t size, int cursor, char *buffer) {

  int wlen = size/2;
  uint32_t *dest = new uint32_t[wlen+1];
  unsigned char *ptr = (unsigned char *)(buffer + cursor);
  for(int i=0; i<wlen; i++) {
    #if MARKUP_SIZEOFWCHAR == 4 // sizeof(wchar_t) == 4
      char padding[2] = {'\0','\0'}; 
      dest[i] =  (padding[0] << 24) + (padding[1] << 16) + (ptr[0] << 8) + ptr[1];
    #else // sizeof(wchar_t) == 2
      dest[i] = (ptr[0] << 8) + ptr[1];
    #endif
      ptr += 2;
      cout << ptr;
  }
  return (wchar_t *)dest;
}

我使用填充的方式有任何范围问题吗?当我delete dest[]在调用函数中时,我会泄漏填充吗?

4

2 回答 2

0

区别

#if MARKUP_SIZEOFWCHAR == 4 // sizeof(wchar_t) == 4
  char padding[2] = {'\0','\0'}; 
  dest[i] =  (padding[0] << 24) + (padding[1] << 16) + (ptr[0] << 8) + ptr[1];
#else // sizeof(wchar_t) == 2
  dest[i] = (ptr[0] << 8) + ptr[1];
#endif

完全没有必要。padding[i]是 0,所以左移保持 0,添加没有效果。

编译器可能会或可能不会在每次循环迭代中优化两字节数组的分配padding,但由于它是一个自动数组,它不会以任何方式泄漏。

由于循环中使用的类型是无符号的,只需使用

dest[i] = (ptr[0] << 8) + ptr[1];

非常安全。(字节顺序当然必须是正确的。)

为了

return (wchar_t *)dest;

你应该让 的类型dest取决于 的大小wchar_t,它应该是uint16_t*if sizeof(wchar_t) == 2(and CHAR_BIT == 8)。

于 2012-10-07T18:01:18.987 回答
0

你试图做的事情是行不通的。它在几个方面被打破,但让我们专注于演员阵容。

您的问题与您的代码不符。您的代码使用 a uint32_t,而您的问题询问 a uint16_t。但这没关系,因为两者都行不通

如果你需要使用wchar_t,那么你应该实际使用 wchar_t。如果您的目标是获取 a 的两个连续字节char*并将它们复制到 a 的前两个字节中wchar_t,那么就这样做。

这是您的代码的一个更好的版本,它实际上可以工作char*(在某种程度上,从 a 复制两个字节并假装它是 a是有意义的wchar_t):

std::wstring FileReader::getObjectForSizeAndCursor(int32_t size, int cursor, char *buffer) {

  int wlen = size/2;
  std::wstring out(wlen);
  unsigned char *ptr = (unsigned char *)(buffer + cursor);
  for(int i=0; i<wlen; i++) {
    out[i] = (ptr[0] << 8) + ptr[1];
    ptr += 2;
    cout << ptr;
  }
  return out;
}

另外,由于我们使用了适当的 RAII 类,例如std::wstring.

于 2012-10-07T18:10:35.730 回答