我正在使用 Apache PDFBox 扫描 PDF 以搜索指向某个文件的链接。
我有大约一千个 PDF 文件要扫描,并且大部分链接(事实上,就我现在所见,实际上只有一个)都找到了。
但是,PDFBox 会忽略 PDF 中的一个特定链接。如果我用 Foxit 打开 PDF 并检查链接的属性,它看起来与所有其他链接(确实找到)完全一样。
这是我用来遍历链接的代码:
for( Object p : pages ) {
PDPage page = (PDPage)p;
List<?> annotations = page.getAnnotations();
for( Object a : annotations ) {
PDAnnotation annotation = (PDAnnotation)a;
if( annotation instanceof PDAnnotationLink ) {
PDAnnotationLink link = (PDAnnotationLink)annotation;
/* Do stuff with the link */
}
}
}
在受影响的 PDF 中,page.getAnnotations()
确实返回一个空列表。
除了我应该注意的注释之外,还有其他类型的链接吗?