我有一个问题,需要我从远程机器上解析几个日志文件。有一些复杂性:1)文件可能正在使用 2)文件可能非常大(100mb+) 3)每个条目可能是多行的
要解决使用中的问题,我需要先复制它。我目前正在将它直接从远程机器复制到本地机器,并在那里解析它。这导致了问题 2。由于文件很大,因此在本地复制它可能需要很长时间。
为了增加解析时间,我想让解析器多线程,但这使得处理多行条目有点棘手。
两个主要问题是:1)我如何加快文件传输(压缩?,是否需要在本地传输?,我可以通过其他方式读取正在使用的文件吗?) 2)我如何处理多行条目在线程之间拆分行时?
更新:我没有对服务器进行明显解析的原因是我希望对 CPU 的影响尽可能小。我不想影响系统即时测试的性能。