我有一个项目,我必须在结构化 PDF 文档中突出显示文本并对其进行分类,以便我可以对多个子字符串执行正则表达式并为它们各自的变量提供正确的值。有没有办法让屏幕提示 PDF对所有不同的感兴趣的子字符串执行正则表达式?
现在我正在使用 python 中的 pdfplumber 库逐行提取 PDF 中的文本并将其附加到字符串中,以便我可以对其执行正则表达式。
我希望能够仅突出显示 pdf 文件中的多行文本并分别对它们进行分类,以便我可以将它们作为参数发送到我自动使用的任何正则表达式库并获取多个正则表达式和/或一个正则表达式作为回报?