13

我需要顺序读取一个大文件(大约 10GB)的所有块,该文件包含许多带有一些字符串的浮点数,如下所示(每个项目由 '\n' 分割): 6.292611 -1.078219E-266 -2.305673E+065 sod;eiwo 4.899747e-237 1.673940e+089 -4.515213

MAX_NUM_PER_FILE我每次都读取项目并处理它们并写入另一个文件,但我不知道何时ifstream结束。这是我的代码:

ifstream file_input(path_input);  //my file is a text file, but i tried  both text and binary mode, both failed.
if(file_input)
{
    file_input.seekg(0,file_input.end);
    unsigned long long length = file_input.tellg();    //get file size
    file_input.seekg(0,file_input.beg);

    char * buffer = new char [MAX_NUM_PER_FILE+MAX_NUM_PER_LINE];
    int i=1,j;
    char c,tmp[3];
    while(file_input.tellg()<length)
    {
        file_input.read(buffer,MAX_NUM_PER_FILE);
        j=MAX_NUM_PER_FILE;
        while(file_input.get(c)&&c!='\n')
            buffer[j++]=c;   //get a complete item

        //process with buffer...

        itoa(i++,tmp,10);    //int2char
        string out_name="out"+string(tmp)+".txt";
        ofstream file_output(out_name);
        file_output.write(buffer,j);
        file_output.close();
    }

    file_input.close();
    delete[] buffer;
}

我的代码出错了,length大于实际文件大小。我试过file_input.good()or !file_input.eof(),他们没有工作,很好,但它比我想要getline(file_input,s)的要慢得多,但我不知道如何检查是否是文件结尾。readreadifstream

我在 WINDOWS 7 中使用 VS2010 完成我的工作。

我已经搜索过,但没有任何答案,如何使用 ifstream 打开文件并继续阅读,直到最后这个链接无法回答我的问题。


更新,问题解决

大家好,我发现这是我的错。两者都while(file_input.tellg()<length)工作while(file_input.peek()!=EOF)正常!while(file_input.peek()!=EOF)被推荐。

文件结尾后写入的额外项是buffer上次写入的剩余项。

这是正确的代码:

ifstream file_input(path_input);
if(file_input)
{
    //file_input.seekg(0,file_input.end);
    //unsigned long long length = file_input.tellg();   //get file size
    //file_input.seekg(0,file_input.beg);

    char * buffer = new char [MAX_NUM_PER_FILE+MAX_NUM_PER_LINE];
    int i=1,j;
    char c,tmp[3];
    while(file_input.peek()!=EOF)
    {
        memset(buffer,0,sizeof(char)*(MAX_NUM_PER_FILE+MAX_NUM_PER_LINE));  //clear first!
        file_input.read(buffer,MAX_NUM_PER_FILE);
        j=MAX_NUM_PER_FILE;
        while(file_input.get(c)&&c!='\n')
            buffer[j++]=c;

        itoa(i++,tmp,10);//int2char
        string out_name="out"+string(tmp)+".txt";
        ofstream file_output(out_name);
        file_output.write(buffer,strlen(buffer));   //use the correct buffer size instead of j
        file_output.close();
    }

    file_input.close();
    delete[] buffer;
}
4

1 回答 1

25
while( file_input.peek() != EOF )
{
    // code
}

基本上peek()会在char不提取的情况下阅读下一个。

因此,您可以简单地将其与EOF.

于 2015-01-23T07:55:18.753 回答