perl - 我应该使用 Parse::RecDescent 还是 Regexp::Grammars 从文档中提取表格？

Question

我有很多希望用 perl 解析的大型纯文本文档。每个文档中主要包含英文段落，每个文档中都有几个纯文本标记的表格。

我创建了一个语法来描述表结构，但不确定是否最好使用 Parse::RecDescent 或 Regexp::Grammars 来提取表。

我最初倾向于 Parse::RecDescent，但我不确定在语法中你将如何处理我想忽略的 90% 的文档文本，以便找到我想要提取的几个表隐藏在每个表中文档。

也许我需要 Regexp::Grammars 以便我可以通过文档“拉”我的表达式，直到找到匹配项？

谢谢

score 1 · Accepted Answer

Regexp::Grammars 是我想要的，因为它允许您通过文档提取语法并像正则表达式一样查找匹配项。Parse::RecDescent 似乎不适合扫描文档并仅查找与语法匹配的文本。

1 回答 1