-1

我正在尝试通过 C++ 阅读一个巨大的 txt。它有70mb。我的目标是逐行子串并生成另一个较小的 txt,其中仅包含我需要的信息。

我得到了下面的代码来读取文件。它适用于较小的文件,但不适用于 70mb 的怪物。

#include "stdafx.h"
#include <iostream>
#include <fstream>
#include <string>

using namespace std;

int main()
{
  ifstream myReadFile;
  myReadFile.open("C:/Users/Lucas/Documents/apps/COTAHIST_A2010.txt");
  char output[100];
  if (myReadFile.is_open()) {
    while (myReadFile.eof()!=1) {
         myReadFile >> output;
         cout<<output;
         cout<<"\n";
     }


    }
  system("PAUSE");
  return 0;
}

这是我得到的错误:SeparadorDeAcoes.exe 中 0x50c819bc (msvcp100d.dll) 处的未处理异常:0xC0000005:访问冲突读取位置 0x3a70fcbc。

如果有人可以用 C 甚至 C# 指出解决方案,那也是可以接受的!

谢谢 =)

4

3 回答 3

6

您的char output[100]缓冲区无法获取其中一行的内容。

理想情况下,您应该使用字符串目标,而不是char[]缓冲区。

编辑正如已经指出的那样,这是不好的做法,并导致阅读最后一行两次或最后一行空无一物。更正确的循环写法是:

string output;
while (getline(myReadFile, output)) {
  cout<<output<<"\n";
}

**编辑 - 在这里留下坏的,邪恶的代码:

快速重写您的内部 while 循环可能是:

string output;
while (myReadFile.good()) {
  getline(myReadFile, output);
  cout<<output<<"\n";
}
于 2012-05-03T17:12:58.850 回答
2

我认为您的问题是您的其中一行超过 100 个字符。需要增加字符数组的大小。

于 2012-05-03T17:12:31.023 回答
0

您没有使用std::string,但包含头文件。决定。使用其中一个std::string或字符数组。

此外,使用std::istream::read数组的大小并将其提供给函数。您需要重复多次,因为 100 个字符远小于 70mb。

尝试使用动态内存分配更大的数组:

const unsigned int array_size = 1024 * 1024 * 1024;

int main(void)
{
  char * output;
//...
  output = new char [array_size];
// read into output
// ...
// clean up
  delete [] output;
  return EXIT_SUCCESS;
}

如果您使用std::string,请使用带有大小参数的构造函数,以便您可以指定字符串的初始大小。

于 2012-05-03T17:18:51.300 回答