1

我目前正在用 Java 实现 Oracle OutsideIn Search 和 Export 工具,以提取不同文件的元数据和内容。我能够对一个文件夹中的多个文件执行此操作,但是我无法提取嵌入在另一个文件中的文件。我想知道这在搜索和导出中是否可行。

如果没有,我会选择 CleanContent,但它只接受 Microsoft 和 PDF 文件。

4

1 回答 1

1

搜索导出可以转换或从档案或其他类型的文件中提取嵌入文件。我们区分了三种不同类型的嵌入,每一种都有自己的选项来控制它们的转换。这三种类型是归档子文档、电子邮件附件和通用嵌入。默认情况下,前两个被转换,但第三个不是。要启用通用嵌入转换,请在 SCCOPT_XML_SEARCHML_FLAGS 选项中设置 SCCEX_XML_EMBEDDINGS 标志。如果您使用 SDK 提供的导出器示例应用程序,请尝试在您的 CFG 文件中启用以下内容。

嵌入标志是

如果您尝试提取嵌入的二进制副本,则需要三个步骤。在初始转换时,在 SCCOPT_XML_SEARCHML_FLAGS 选项中设置 SCCEX_XML_PRODUCEOBJECTINFO 标志。使用该信息进行所需的嵌入,以填充传递给 DAOpenDocument 的 SCDAOBJECT 结构。从该函数返回的 hDoc 可以传递给 DASaveInputObject 以保存嵌入的二进制副本。这适用于上述三种嵌入中的任何一种。没有演示此过程的 Java 示例应用程序。

于 2013-04-30T19:04:29.093 回答