我和另一个帖子中描述的人有同样的问题。我的应用程序的日志文件很大(~1GB),使用 grep 来关联来自日志文件的信息很繁琐。现在我使用''less''工具,但它也比我想要的慢。
我正在考虑加快搜索速度。有以下方法可以做到这一点:首先,在 XML 中生成日志并使用一些 XML 搜索工具。我不确定使用 XML 搜索会获得多少加速(我猜不多,因为非索引文件搜索仍然需要很长时间)。
其次,使用XML 数据库。这会更好,但我在这里没有太多背景。
第三,使用(非 XML)数据库。这会有点乏味,因为必须编写表模式(是否也要为上面的第二个选项完成?)。我还预见到架构一开始会发生很大变化,以包括常见的用例。理想情况下,我想要比用于存储日志的成熟数据库更轻的东西。
第四,使用lucene。它似乎符合目的,但有没有一种简单的方法来指定当前用例的索引?例如,我想说“每当你看到‘迭代’这个词时就索引”。
你有什么意见?