5

是否有 C/C++ 方法使用 read() 从套接字读取数据,并且接收缓冲区是文件(ofstream)或类似的自扩展对象(例如向量)?

编辑: 当我考虑如何读取可能接收 10000+ 字节文件内容的流套接字时,问题出现了。我只是从来没有喜欢将 20000 或 50000 字节(现在足够大)作为缓冲区放在堆栈上,文件可以在其中临时存储,直到我可以插入文件。为什么不直接将其流式传输到文件中以进行加注。

就像您可以在std:string中获取char *一样,我想到了类似的东西

read( int fd, outFile.front(), std::npos );  // npos = INT_MAX

或类似的东西。

结束编辑

谢谢。

4

2 回答 2

4

这很简单,而且我的手指头,但我认为这些方面的事情会奏效:

template <unsigned BUF_SIZE>
struct Buffer {
    char buf_[BUF_SIZE];
    int len_;
    Buffer () : buf_(), len_(0) {}
    int read (int fd) {
        int r = read(fd, buf_ + len_, BUF_SIZE - len_);
        if (r > 0) len_ += r;
        return r;
    }
    int capacity () const { return BUF_SIZE - len_; }
}

template <unsigned BUF_SIZE>
struct BufferStream {
    typedef std::unique_ptr< Buffer<BUF_SIZE> > BufferPtr;
    std::vector<BufferPtr> stream_;
    BufferStream () : stream_(1, BufferPtr(new Buffer<BUF_SIZE>)) {}
    int read (int fd) {
        if ((*stream_.rbegin())->capacity() == 0)
            stream_.push_back(BufferPtr(new Buffer<BUF_SIZE>));
        return (*stream_.rbegin())->read(fd);
    }
};

在评论中,您提到您希望避免创建大的字符缓冲区。使用read系统调用时,执行少量大读取通常比执行许多小读取更有效。因此,大多数实现将选择大输入缓冲区来获得这种效率。你可以实现类似的东西:

std::vector<char> input;
char in;
int r;
while ((r = read(fd, &in, 1)) == 1) input.push_back(in);

但这将涉及系统调用和为每个输入字节复制至少一个字节。相比之下,我提出的代码避免了额外的数据副本。

我真的不希望我发布的代码是您会采用的解决方案。我只是想为您提供一个说明,说明如何创建一个相当节省空间和时间的自扩展对象。根据您的目的,您可能想要扩展它,或编写自己的。在我的脑海中,一些改进可能是:

  • 改为使用std::list,以避免矢量调整大小
  • 允许 API 一个参数来指定读取多少字节
  • 用于始终允许一次读取readv至少BUF_SIZE字节(或多于字节)BUF_SIZE
于 2012-06-26T22:02:40.327 回答
0

看看boost::asio.

于 2012-06-26T21:29:10.973 回答