我正在使用 Python 开发一个工具来从 PDF 文件中提取突出显示的段落。我经常在 OS X Lion 上的 Preview 中突出显示 PDF,但还没有找到提取这些段落的好工具。存在其他允许您突出显示和导出的应用程序,例如 Skim,但我认为必须有一种方法来提取我在预览中添加的应用程序。
我认为突出显示将存储在 PDF 文件的 HFS+ 扩展属性中,但在使用 xattr 查看它们之后,它们似乎存储在其他地方。我还查看了 PDFKit,但我只看到了如何创建注释而不是找到它们。
如果有人能告诉我在哪里可以找到亮点/注释或指向一些解释这一点的文档,我将不胜感激。