3

我有一些文本解析,无论是从文件还是从字符串流中读取,我都希望行为相同。因此,我正在尝试使用 anstd::istream来执行所有工作。在字符串版本中,我试图让它从我创建的静态内存字节数组(最初来自文本文件)中读取。假设原始文件如下所示:

4

对应的字节数组是这样的:

const char byte_array[] = { 52, 13, 10 };

其中 52 是字符 4 的 ASCII,然后是回车,然后是换行。

当我直接从文件中读取时,解析工作正常。

当我尝试像这样以“字符串模式”阅读它时:

std::istringstream iss(byte_array);
std::istream& is = iss;

我最终将回车卡在使用此方法从字符串流中检索到的字符串的末尾:

std::string line;
std::getline(is, line);

这搞砸了我的解析,因为该string.empty()方法不再在“空白”行上触发——每行至少包含一个13用于回车的回车,即使它在生成二进制数据的原始文件中是空的。

为什么在这方面的ifstream行为不同于istringstream?我怎样才能让istringstream版本像版本一样丢弃回车ifstream

4

1 回答 1

2

std::ifstream默认情况下以文本模式运行,这意味着它将非 LF 行结尾转换为单个 LF。在这种情况下,是在看到std::ifstream之前删除 CR 字符。std::getline()

std::istringstream不对源字符串做任何解释,并且传递字符串中的所有字节。

需要注意的是,它std::string代表一个字节序列,而不是字符。通常std::string用于存储 ASCII 编码的文本,但它们也可用于存储任意二进制数据。假设是,如果您已将文件中的文本读入内存,则您已经完成了任何文本转换,例如行尾的标准化。

正确的做法是在读取文件时转换行尾。在这种情况下,看起来您正在从文件生成代码。读取文件并将其转换为代码的程序应该消除 CR 字符。

另一种方法是编写一个流包装器,它接受一个std::istream并将读取操作委托给它,即时转换行尾。这种方法是可行的,但可能很难做到正确。(特别是有效地处理寻找将是困难的。)

于 2013-08-12T20:38:29.927 回答