7

我正在尝试从 a 中读取行,std::istream但输入可能包含'\r' 和/或 '\n',所以std::getline没有用。

很抱歉大喊大叫,但这似乎需要强调......

输入可能包含换行符类型两者

有没有标准的方法来做到这一点?目前我正在尝试

char c;
while (in >> c && '\n' != c && '\r' != c)
    out .push_back (c);

...但这会跳过空格。哦!std::noskipws-需要更多的摆弄,现在它很糟糕。

当然必须有更好的方法?!?

4

2 回答 2

4

读取一行的常用方法是使用std::getline.

编辑:如果您的实现std::getline被破坏,您可以编写自己的类似内容,如下所示:

std::istream &getline(std::istream &is, std::string &s) { 
    char ch;

    s.clear();

    while (is.get(ch) && ch != '\n' && ch != '\r')
        s += ch;
    return is;
}

我应该补充一点,从技术上讲,这可能不是std::getline被破坏的问题,因为底层流实现被破坏 - 由流从表示平台行尾的任何字符转换为换行符. 但是,无论哪些部分被破坏,如果您的实现被破坏,这可能能够弥补它(同样,如果您的实现被破坏得足够严重,也很难确定这是否会起作用)。

于 2011-07-14T14:21:13.843 回答
4

好的,这是一种方法。基本上我已经做了一个std::getline接受谓词而不是字符的实现。这让你有 2/3 的路程:

template <class Ch, class Tr, class A, class Pred>
std::basic_istream<Ch, Tr> &getline(std::basic_istream<Ch, Tr> &is, std::basic_string<Ch, Tr, A>& str, Pred p) {

    typename std::string::size_type nread = 0;      
    if(typename std::istream::sentry(is, true)) {
        std::streambuf *sbuf = is.rdbuf();
        str.clear();

        while (nread < str.max_size()) {
            int c1 = sbuf->sbumpc();
            if (Tr::eq_int_type(c1, Tr::eof())) {
                is.setstate(std::istream::eofbit);
                break;
            } else {
                ++nread;
                const Ch ch = Tr::to_char_type(c1);
                if (!p(ch)) {
                    str.push_back(ch);
                } else {
                    break;
                }
            }
        }
    }

    if (nread == 0 || nread >= str.max_size()) {
        is.setstate(std::istream::failbit);
    }

    return is;
}

使用与此类似的函子:

struct is_newline {
    bool operator()(char ch) const {
        return ch == '\n' || ch == '\r';
    }
};

现在,唯一剩下的就是确定你是否以 a 结尾'\r'......,如果你这样做了,那么如果下一个字符是 a '\n',只需使用它并忽略它。

编辑:所以要把这一切都放到一个功能性的解决方案中,这里有一个例子:

#include <string>
#include <sstream>
#include <iostream>

namespace util {

    struct is_newline { 
        bool operator()(char ch) {
            ch_ = ch;
            return ch_ == '\n' || ch_ == '\r';
        }

        char ch_;
    };

    template <class Ch, class Tr, class A, class Pred>
        std::basic_istream<Ch, Tr> &getline(std::basic_istream<Ch, Tr> &is, std::basic_string<Ch, Tr, A>& str, Pred &p) {

        typename std::string::size_type nread = 0;

        if(typename std::istream::sentry(is, true)) {
            std::streambuf *const sbuf = is.rdbuf();
                str.clear();

            while (nread < str.max_size()) {
                int c1 = sbuf->sbumpc();
                if (Tr::eq_int_type(c1, Tr::eof())) {
                    is.setstate(std::istream::eofbit);
                    break;
                } else {
                    ++nread;
                    const Ch ch = Tr::to_char_type(c1);
                    if (!p(ch)) {
                        str.push_back(ch);
                    } else {
                        break;
                    }
                }
            }
        }

        if (nread == 0 || nread >= str.max_size()) {
            is.setstate(std::istream::failbit);
        }

        return is;
    }
}

int main() {

    std::stringstream ss("this\ris a\ntest\r\nyay");
    std::string       item;
    util::is_newline  is_newline;

    while(util::getline(ss, item, is_newline)) {
        if(is_newline.ch_ == '\r' && ss.peek() == '\n') {
            ss.ignore(1);
        }

        std::cout << '[' << item << ']' << std::endl;
    }
}

我对我原来的例子做了一些小的改动。该Pred p参数现在是一个引用,因此谓词可以存储一些数据(特别是最后char测试的数据)。同样,我使谓词operator()非常量,以便它可以存储该字符。

在 main 中,我在 a 中有一个字符串,std::stringstream其中包含所有 3 个版本的换行符。我使用 my util::getline,如果谓词对象说最后一个char是 a '\r',那么我peek()会提前忽略1字符(如果它恰好是'\n')。

于 2011-07-14T15:12:52.253 回答