6

我尝试在Java中写入Json格式,但是当文件大小> 1GB时遇到NullPointerException。谁能帮我解决这个问题?

代码不断生成Json文件,文件大小不断增加。一旦文件大小> 1GB,代码将抛出异常,如下所示。我使用不同的数据集进行测试,所以我认为不是数据问题。我的猜测是 Java 中的 Gson.toJson 有大小限制。

我的代码是:

private HashMap<String,HashSet<Token>> tokenCounter = new HashMap<String,HashSet<Token>>();

....

private void writeToFile(){
  try {
    PrintWriter out = new PrintWriter(outputFileName);
    out.println(gson.toJson(tokenCounter));
    out.close();
    } catch (IOException e) {
      e.printStackTrace();
  } 
}

它抛出的异常是:

java.lang.NullPointerException
    at java.lang.String.<init>(String.java:301)
    at java.lang.StringBuffer.toString(StringBuffer.java:790)
    at java.io.StringWriter.toString(StringWriter.java:204)
    at com.google.gson.Gson.toJson(Gson.java:481)
    at com.google.gson.Gson.toJson(Gson.java:460)
    at com.ebay.classification.discovery.DailyDiscovery.writeToFile(DailyDiscovery.java:181)
    at com.ebay.classification.discovery.DailyDiscovery.run(DailyDiscovery.java:169)
    at com.ebay.classification.discovery.TestDailyDiscoveryContinue.run(TestDailyDiscoveryContinue.java:142)
    at com.ebay.classification.discovery.TestDailyDiscoveryContinue.main(TestDailyDiscoveryContinue.java:245)
4

1 回答 1

3

发布为解决评论中格式问题的答案。

2^30 个字符的数组将是 2^31 个字节。作为一个单一的字符串,这是巨大的!需要问的一个明显问题是为什么你有代码:

PrintWriter out = new PrintWriter(outputFileName);
out.println(gson.toJson(tokenCounter));
out.close();

这可以很容易地写成:

FileWriter out = new FileWriter(outputFileName);
gson.toJson(tokenCounter, out);
out.flush();
out.close();

这不会对内存产生重大影响,并且会更快。

这并不能回答为什么您在大型 StringWriter 中获得 NPE 的问题,但坦率地说,您所做的事情是荒谬的......

于 2013-05-05T00:28:44.113 回答