2

我有两个文本文件,在文本编辑器中看起来是相同的,但是我用于读取文件的 C++ 代码为每个文件生成不同的行数。我不知道文件在哪里不同,或者如何在我的 C++ 代码中适应这种差异。

让我解释...

我有两个文本文件,d1.txt 和 d2.txt。每个包含 100 个数字,每行 1 个。当我在 vim 中打开任一文件并输入:set list!时,只有 100 行,每行包含一个数字和每行最后一个数字后的行尾字符 ($)。换句话说,在 vim 中查看它们时,它们看起来相同,只是数字的精度不同。精度不同,因为一个文件来自 MATLAB,另一个来自 Gnumeric。

文件的快速差异呈现以下输出(我使用大括号省略号“[...]”来省略部分以节省空间):

1,28c1,28
< 0.01218465532007
       [...]
< 0.01327976337895
---
> 0.0121846553200678
       [...]
> 0.0132797633789485
30,100c30,100
< 0.01329705254301
       [...]
< 0.00017832496354
---
> 0.0132970525430057
       [...]
> 0.000178324963543758
\ No newline at end of file

尽管有关于第二个文件(d2.txt)末尾没有换行符的消息,但正如我上面提到的,在 vim 中检查文件的最后一行时,我看不出任何区别。

我创建了一个 C++ 函数,该函数readVectorFromFile(std::vector<double>&,const string)返回从相应文本文件中读取的行数。当我使用代码阅读文本文件时:

std::cout << "d1.txt has " << readVectorFromFile(v1,"./d1.txt") << " lines.\n";
std::cout << "d2.txt has " << readVectorFromFile(v1,"./d1.txt") << " lines.\n";

我得到输出:

d1.txt has 99 lines.
d2.txt has 100 lines.

函数定义如下:

int readVectorFromFile(vector<double>& vec, const string& fullFilePathName) {

    int value, numLines;
    char line[10000];
    ifstream inFile;

    /* attempt to open file */
    inFile.open(fullFilePathName.c_str());
    if (inFile.fail()) {
        LOG(FATAL) << "Unable to open file \"" << fullFilePathName.c_str() << "\" for reading.";
    } else {
        cout << "Importing vector from file " << fullFilePathName.c_str() << "\n";
    }

    /* records the number of lines in the input file */
    numLines = static_cast<int>( count(istreambuf_iterator<char>(inFile),
                                       istreambuf_iterator<char>(), '\n') );

    /* start file over from beginning */
    inFile.clear();
    inFile.seekg(0, ios::beg);

    vec.clear(); // clear current vec contents
    vec.reserve(numLines);

    /* read value from each line of file into vector */
    for(int i=0; i<numLines; ++i) {
        inFile.getline(line, 10000);
        vec.push_back( strtod(line,NULL) );
    }

    inFile.close(); // close filestream

    return numLines; // return the number of lines (values) read

}

为什么我在 vim 中查看这些文件时看不到它们之间的区别?导致此问题的上述功能是否存在根本性错误?

4

1 回答 1

2

根据您的描述,两个文件之一的末尾没有换行符。您可以查看文件,例如od -c file | less查看文件的确切内容,包括它们的字符代码。

也就是说,您阅读行的方法可能会得到改进:只需读取一行,检查它是否可以读取,然后处理它。这样,就无需预先计算行尾数:

for (std::string line; std::getline(inFile, line); ) {
    vec.push_back(strtod(line.c_str()));
}

就个人而言,我可能会首先阅读数字,例如:

for (double value; inFile >> value; ) {
    vec.push_back(value);
}

好吧,这并不是将 s 序列读double入向量的真正方法,但这是:

std::vector<double> vec((std::istream_iterator<double>(inFile)),
                        std::istream_iterator<double>());

(代替额外的括号,您可以在 C++11 中使用统一初始化符号)。

于 2013-08-26T00:49:37.263 回答