当读取在 Windows 机器上创建的文件时,这是 Unix 机器上的一个普遍问题。我建议在输入级别进行清理。
我在读取基于行的文件时发现的最佳解决方案之一是创建一个类似的类:
class Line
{
std::string myText;
public:
friend std::istream& operator>>( std::istream& source, Line& dest )
{
std::getline( source, dest.myText );
if ( source ) {
dest.myText.erase(
std::remove( dest.myText.begin(), dest.myText.end(), '\015' ),
dest.myText.end() );
}
return source;
}
operator std::string() const
{
return myText;
}
};
您可以根据需要添加其他功能:例如,在尝试匹配模板时不会播放自动类型转换,我发现添加朋友到 wrap 很有用boost::regex_match
。
'\015'
即使我不必担心 Windows/Linux 的差异,我也会使用它(没有删除);例如,它支持使用 读取行
std::istream_iterator<Line>
。
另一种解决方案是使用过滤streambuf,插入到输入流中。这也很简单:
class RemoveCRStreambuf : public std::streambuf
{
std::streambuf* mySource;
char myBuffer; // One char buffer required for input.
protected:
int underflow()
{
int results = mySource->sbumpc();
while ( results == '\015' ) {
results = mySource->sbumpc();
}
if ( results != EOF ) {
myBuffer = results;
setg( &myBuffer, &myBuffer + 1, &myBuffer + 1 );
}
return results;
}
public:
RemoveCRStreambuf( std::streambuf* source )
: mySource( source )
{
}
};
要插入它:
std::streambuf* originalSB = source->rdbuf();
RemoveCRStreambuf newSB( originalSB );
source->rdbuf( &newSB );
// Do input here...
source->rdbuf( originalSB ); // Restore...
(显然,使用某种 RAII 进行恢复会更可取。我自己的过滤流缓冲区有一个构造函数,它接受一个std::istream
;他们也保存一个指向 this 的指针,并在其析构函数中恢复流缓冲区。)