我有很多希望用 perl 解析的大型纯文本文档。每个文档中主要包含英文段落,每个文档中都有几个纯文本标记的表格。
我创建了一个语法来描述表结构,但不确定是否最好使用 Parse::RecDescent 或 Regexp::Grammars 来提取表。
我最初倾向于 Parse::RecDescent,但我不确定在语法中你将如何处理我想忽略的 90% 的文档文本,以便找到我想要提取的几个表隐藏在每个表中文档。
也许我需要 Regexp::Grammars 以便我可以通过文档“拉”我的表达式,直到找到匹配项?
谢谢