1

我有一个数据库,其中包含大量作为 OLE 对象嵌入到 Notes RichText 字段中的 PDF 文档。这些与 XPage 不兼容,因此我需要将 OLE 对象转换为文件(附件)。我怎样才能以自动方式做到这一点(我知道它必须在 Notes 客户端中运行(必须吗?) - 或者是否有一种 POI 方法来提取它们?

澄清
我可以提取 blob(如果需要,可以将其提取到内存中),但是将其写入磁盘不会创建 PDF 文件,因为该 blob 是一个 OLE 容器。所以我看到了 2 条可能的路径:

  • 激活 OLE 对象并使用其中的方法
  • 阅读 blob 并获取一些提取 PDF 部分的内容(可能是Apache POI

但我还没有接触过这些方法中的任何一种,我想知道一些建议是否可以节省我数小时的测试时间

4

2 回答 2

1

dxl工具可以吗?我已经使用 dxl 导出器从文档中提取嵌入的图像,也许这对 ole 对象也是可行的?

我在 openntf 上使用了lotusscript gold collection 项目的 EmbeddedImage 对象的一个​​稍微改变的版本

该库包含一个对象 Embeddedimagelist,它在 DXL 中搜索图片标签并尝试解析其内容。也许这也适用于嵌入式 ole 对象。

于 2012-10-23T09:08:25.750 回答
0

我认为搜索 %PDF 然后将所有内容保存为文件应该是五个 PDF。从理论上讲,OLE 文件中可能有很多东西,但在大多数情况下,您会得到一个简单地以 OLE 标头(或其他名称)作为前缀的文件。

我曾在一个场合使用过这种方法(虽然不是用于 PDF),它似乎工作正常。

我想这就是 jjtbsomhorst 所说的 openntf 方法是基于 :-)

于 2013-12-24T06:50:47.947 回答