3

我有很多希望用 perl 解析的大型纯文本文档。每个文档中主要包含英文段落,每个文档中都有几个纯文本标记的表格。

我创建了一个语法来描述表结构,但不确定是否最好使用 Parse::RecDescent 或 Regexp::Grammars 来提取表。

我最初倾向于 Parse::RecDescent,但我不确定在语法中你将如何处理我想忽略的 90% 的文档文本,以便找到我想要提取的几个表隐藏在每个表中文档。

也许我需要 Regexp::Grammars 以便我可以通过文档“拉”我的表达式,直到找到匹配项?

谢谢

4

1 回答 1

1

Regexp::Grammars 是我想要的,因为它允许您通过文档提取语法并像正则表达式一样查找匹配项。Parse::RecDescent 似乎不适合扫描文档并仅查找与语法匹配的文本。

于 2011-10-12T03:03:08.097 回答