我正在执行日志分析,我希望将其自动化,以便它每天运行并报告结果。分析在标准工作站、8 核、高达 32 GB 的可用 RAM 上运行。原型基于 GNU Grep (--mmap)、Sqlite(在 RAM 磁盘上)和 Bash(用于参数)。
一个问题是我需要多次浏览这些文件。如果我找到一个模式匹配,我会向上搜索相关的东西。这可能会变得递归,并且每次它重新读取千兆字节的数据。
C中是否有任何快速方法/ lib用于内存支持的分段多线程文件读/写?
当我查看“内存中”搜索(在加载的段内上下移动,或在必要时加载更多)时,我觉得这是一个非常普遍的要求。