我需要处理一个大文件(具有列和相同格式的行)。由于我需要考虑程序在处理过程中崩溃的情况,我需要这个处理程序是可重试的,这意味着它崩溃后我再次启动程序,它可以继续处理从它失败的行开始的文件。
有什么我可以遵循的模式或我可以使用的库吗?谢谢!
更新:
关于崩溃案例,不仅仅是OOM或一些内部问题。这也可能是由于其他部件超时或机器崩溃造成的。所以 try/catch 无法处理这个问题。
另一个更新:
关于分块文件,在我的情况下是可行的,但并不像听起来那么简单。正如我所说,该文件被格式化为几列,我可以根据其中一列将其拆分为数百个文件,然后一一处理这些文件。但不是这样做,我想了解更多关于处理支持重试的大文件/数据的常见解决方案。