6

我想对此有一些见解。

我有一个从数据库读取和写入 excel 文件的程序。它的执行基于使用 Quartz api 的计时器,并在每周的每个星期二触发。问题是,当我通过安排它每小时执行一次作业来测试它时,程序在编写 excel 文件的过程中执行了几次后突然停止。这是我写的excel代码。

try {
        FileInputStream file = new FileInputStream(excelFile);
        POIFSFileSystem myFileSystem = new POIFSFileSystem(file);
        HSSFWorkbook workbook = new HSSFWorkbook(myFileSystem);
        HSSFSheet worksheet = workbook.getSheetAt(0);
        this.cellStyle00 = workbook.createCellStyle();
        HSSFDataFormat df = workbook.createDataFormat();
        this.cellStyle00.setDataFormat(df.getFormat("00"));

for(int i = 0;i<Access.size();i++){
         AccessorMethods SetGet = (AccessorMethods)
                    InstlibAccessor.get(i);

    HSSFRow row = worksheet.createRow(worksheet.getPhysicalNumberOfRows());
    HSSFCell cell = row.createCell(0);

    cell.setCellValue(new Double(SetGet.getOne()));
    cell.setCellStyle(cellStyle00);


  //other set value codes....

}
FileOutputStream fileOut = new FileOutputStream(fileName + ".xls");
workbook.write(fileOut);
 fileOut.flush();
 fileOut.close(); 

 //catch statements follow
 //end

命令行输出和netbeans输出不表示任何错误,如内存不足等。程序没有结束..它只是,停止..就像jvm正在无限循环中工作......为了阐明更多信息关于这个主题,这是我的程序的简要流程。

  1. 用户执行调度程序
  2. 在调度程序执行程序所需的时间(调度程序和“程序”是两个不同的程序/jar文件。调度程序只是调用jar)
  3. 该程序首先创建 excel 文件
  4. 然后读取数据库1。数据库包含80K行
  5. 对于每一行,如果满足某个条件,则读取数据库 2 和 3
  6. 然后它一次将它存储在一个arraylist对象1000中(我试图避免任何内存问题,所以我批量存储它)
  7. 然后我分批写,一次 1000 以 excel (这是它停止的部分)
  8. 完成读写后,它会等到调度程序再次调用它......如果它到达这一步我是一个快乐的程序员=)

以下是我发现的一些观察结果;

  1. 程序通常在程序的第 4 到第 6 次执行时停止(即在不间断运行调度程序程序 4 或 6 小时后)
  2. 它停在 excel 中的随机写入点,例如第 34 千行或第 24 或第 15 行等...
  3. 当我在没有调度程序的情况下执行程序时不会发生此错误。我可以整天手动执行它(我做到了,这不是很有趣),没有任何错误。
  4. 输出 excel 文件显示 0bytes 作为大小
  5. 例如,如果我安排它每小时运行一次,并且在这个小时内它停止了。它仍会在接下来的几个小时内运行,但会停止,并在与上一次运行相比不同的点停止。

是什么导致了这个问题。也许是内存泄漏或更简单的东西?

附加信息

我通过导入其他程序的类来实现 Quartz 调度程序并将其作为作业运行。这是触发器的代码

JobDetail job = newJob(ExtractorSchedulerJobUtilTester.class)
            .withIdentity("job1", "group1")
            .build();

    CronTrigger trigger = newTrigger()
            .withIdentity("trigger1", "group1")
            .withSchedule(cronSchedule("0 0/2 * 1/1 * ? *"))
            .build();

    Date ft = sched.scheduleJob(job, trigger);
        sched.start();

和工作

public class ExtractorSchedulerJobUtilTester implements Job {
    public void execute(JobExecutionContext context)
        throws JobExecutionException {
    theProgram program= new theProgram();

    program.main();

    JobKey jobKey = context.getJobDetail().getKey();
    }
}

有没有可能;

  1. 该应用程序正在耗尽我的内存并崩溃
  2. 我只在我的 Quartz 作业中使用了一个“程序”实例,该实例在作业的第一次运行时被初始化,并且该作业的所有后续执行都是从该实例引用的,从而最大化内存。
  3. 它与数据库(AS400)相关(我怀疑是因为它在编写 excel 时停止了)。
  4. 电脑太累了,决定休息一下。

更新 - 2012 年 12 月 28 日

新年快乐伙计们/姑娘们!

抱歉,我花了一些时间才重新开始……(既然世界将在 21 日结束,为什么还要浪费时间在这上面。如果没有,那真是苦乐参半)

我用 netbeans 分析器分析了我的程序,并用内存分析器得到了以下数字

内存转储

我注意到在第一张图中,我的程序每次迭代消耗了大约 75MB 的堆大小(如粉红色阴影所示)。这是否意味着程序每次迭代消耗的内存增加了 75mb?在几次迭代之后,这将消耗大量内存,从而影响程序的执行。我目前正在尝试进行堆转储。一旦我设法让它运行,我就会发布它。

附加信息:我尝试使用仅运行 Quartz 的分析器(不触发任何东西)并且系统使用率相对较低,并且每次迭代的大小都不会增加。

我终于设法得到一个堆转储。我进行了 2 次转储,第一次是第一次迭代发生时,第二次是下一次迭代。我注意到我的两个类的实例之间存在很大差异,如下所示

哈希转储

谢谢!

4

1 回答 1

1

经过大量的诅咒、祈祷和搜索,我想我已经找到了一个可能的解决方案。我所做的是System.gc();在我的 Quartz 作业课程的末尾添加。因此,每次程序完成工作时都会调用垃圾收集。这只是一个可能的解决方案,而不是一个具体的答案,因为我仍然在消耗大量的堆内存(我相信在我的代码混乱的某个地方仍然存在一些内存泄漏)。但是,随着System.gc();我的消耗量大大减少。我只是不确定这是怎么发生的。从逻辑上讲,我认为 GC 只会影响内存分配而不影响程序的内存性能。见下图;上图是有 GC 的图,而下图是没有 GC 的图。

在此处输入图像描述

正如您所见,带有 GC 的内存消耗的堆内存比没有垃圾的内存少。我假设内存使用量与 GC 相同,但是一旦调用 GC,使用的堆空间就会下降。我将暂时使用此解决方案,直到出现更好的答案。

于 2013-01-02T06:25:37.713 回答