16

如何在不复制和保留源 std::string 对象的情况下获得 std::string char 数据的所有权?(我想在不同类型之间使用移动语义。)

我使用 C++11 Clang编译器和Boost

基本上我想做与此等效的事情:

{
    std::string s(“Possibly very long user string”);
    const char* mine = s.c_str();

    // 'mine' will be passed along,
    pass(mine);

    //Made-up call
    s.release_data();

    // 's' should not release data, but it should properly destroy itself otherwise.
}

为了澄清,我确实需要摆脱 std::string: 进一步的道路。该代码同时处理字符串和二进制数据,并且应该以相同的格式处理它。我确实想要来自 std::string 的数据,因为它来自另一个与 std::string 一起工作的代码层。

为了更深入地了解我想要这样做的地方:例如,我有一个异步套接字包装器,它应该能够从用户那里获取 std::string 和二进制数据进行写入。两个“API”写入版本(采用 std::string 或行二进制数据)在内部解析为相同的(二进制)写入。我需要避免任何复制,因为字符串可能很长。

WriteId     write( std::unique_ptr< std::string > strToWrite )
{

    // Convert std::string data to contiguous byte storage
    // that will be further passed along to other
    // functions (also with the moving semantics).
    // strToWrite.c_str() would be a solution to my problem
    // if I could tell strToWrite to simply give up its
    // ownership. Is there a way?

    unique_ptr<std::vector<char> > dataToWrite= ??

    //
    scheduleWrite( dataToWrite );
}

void scheduledWrite( std::unique_ptr< std::vecor<char> > data)
{
    …
}

此示例中的 std::unique_ptr 用于说明所有权转移:具有相同语义的任何其他方法对我来说都可以。

我想知道这种特定情况的解决方案(使用 std::string char 缓冲区)以及字符串、流和类似的一般问题的此类问题:在字符串、流、std 容器和缓冲区类型之间移动缓冲区的技巧。

在不复制的情况下在不同的 API/类型之间传递缓冲区数据时,我还将感谢 C++ 设计方法和特定技术的提示和链接。我提到但没有使用流,因为我在那个主题上摇摆不定。

4

3 回答 3

11

如何在不复制和保留源 std::string 对象的情况下获得 std::string char 数据的所有权?(我想在不同类型之间使用移动语义)

你不能安全地做到这一点。

对于特定的实现,在某些情况下,您可以做一些可怕的事情,例如使用别名来修改字符串中的私有成员变量,以欺骗字符串认为它不再拥有缓冲区。但即使你愿意尝试这个,它也不会总是奏效。例如,考虑小字符串优化,其中字符串没有指向保存数据的某个外部缓冲区的指针,数据位于字符串对象本身内部。


如果您想避免复制,可以考虑将接口更改为 scheduleWrite。一种可能性是:

template<typename Container>
void scheduledWrite(Container data)
{
    // requires data[i], data.size(), and &data[n] == &data[0] + n for n [0,size)
    …
}

// move resources from object owned by a unique_ptr
WriteId write( std::unique_ptr< std::vector<char> > vecToWrite)
{
    scheduleWrite(std::move(*vecToWrite));
}

WriteId write( std::unique_ptr< std::string > strToWrite)
{
    scheduleWrite(std::move(*strToWrite));
}

// move resources from object passed by value (callers also have to take care to avoid copies)
WriteId write(std::string strToWrite)
{
    scheduleWrite(std::move(strToWrite));
}

// assume ownership of raw pointer
// requires data to have been allocated with new char[]
WriteId write(char const *data,size_t size) // you could also accept an allocator or deallocation function and make ptr_adapter deal with it
{
    struct ptr_adapter {
        std::unique_ptr<char const []> ptr;
        size_t m_size;
        char const &operator[] (size_t i) { return ptr[i]; }
        size_t size() { return m_size; }
    };

    scheduleWrite(ptr_adapter{data,size});
}
于 2012-07-02T21:29:40.640 回答
2

此类使用移动语义和 shared_ptr 获取字符串的所有权:

struct charbuffer
{
  charbuffer()
  {}

  charbuffer(size_t n, char c)
  : _data(std::make_shared<std::string>(n, c))
  {}

  explicit charbuffer(std::string&& str)
  : _data(std::make_shared<std::string>(str))
  {}

  charbuffer(const charbuffer& other)
  : _data(other._data)
  {}

  charbuffer(charbuffer&& other)
  {
    swap(other);
  }

  charbuffer& operator=(charbuffer other)
  {
    swap(other);
    return *this;
  }

  void swap(charbuffer& other)
  {
    using std::swap;
    swap(_data, other._data);
  }

  char& operator[](int i)
  { 
    return (*_data)[i];
  } 

  char operator[](int i) const
  { 
    return (*_data)[i];
  } 

  size_t size() const
  {
    return _data->size();
  }

  bool valid() const
  { 
    return _data;
  }

private:
  std::shared_ptr<std::string> _data;

};

示例用法:

std::string s("possibly very long user string");

charbuffer cb(std::move(s)); // s is empty now

// use charbuffer...
于 2012-07-02T22:30:07.847 回答
1

您可以使用多态性来解决此问题。基本类型是统一数据缓冲区实现的接口。然后你会有两个派生类。一个std::string用作源,另一个使用您自己的数据表示。

struct MyData {
    virtual void * data () = 0;
    virtual const void * data () const = 0;
    virtual unsigned len () const = 0;
    virtual ~MyData () {}
};

struct MyStringData : public MyData {
    std::string data_src_;
    //...
};

struct MyBufferData : public MyData {
    MyBuffer data_src_;
    //...
};
于 2012-07-02T22:24:16.250 回答