java - 将各种类型的文档（ods、ms office、pdf）保存到 Jackrabbit 存储库中

Question

我不确定选择哪种方法来存储这些类型的文档，因为关键要求是收集尽可能多的元数据，而 pdf、ods 和 MS Office 文档具有各种类型的元数据......

因此，如果节点树具有“组/用户/类别/文档”或“类别/组/用户/文档”结构（我不确定哪个更好），每个文档都必须有一个属性“ type”如果它是 pdf/doc/odt/ppt 等，我每次都必须对此进行测试，以了解它具有哪些元数据类型，对吗？在我看来非常无效。。

score 9 · Accepted Answer

我个人会尽量避免构建您的层次结构以包含文件类型。这会奏效，但它似乎是强迫和不自然的。

相反，我会将我的层次结构设计为最适合您的应用程序（例如，如果您有组和用户，那么可能是“组/用户”并将用户的文档存储在相应的用户节点下），并使用属性来捕获文件类型和其他元数据。

如果您使用“nt:file”约定将文件上传到 JCR，则每个文件将由一个类型为“nt:file”的节点（根据文件名命名）表示。然后该节点将包含一个名为“jcr:content”的子节点，约定是为此子节点使用“nt:resource”节点类型。在 JCR 2.0 中，“nt:resource”节点类型定义了这些属性定义：

jcr:data (BINARY) 强制
jcr:lastModified (DATE) 自动创建
jcr:lastModifiedBy (STRING) 自动创建
jcr:mimeType (STRING) 受保护？
jcr：编码（字符串）受保护？

请注意，允许 JCR 实现将“jcr:mimeType”和“jcr:encoding”视为受保护，但Jackrabbit和ModeShape都不会这样做（这意味着您可以并且必须手动设置这些属性）。

这是上传文件和设置“jcr:mimeType”属性的代码片段：

// Get an input stream for the file ...
File file = ...
InputStream stream = new BufferedInputStream(new FileInputStream(file));

Node folder = session.getNode("/absolute/path/to/folder/node");
Node file = folder.addNode("Article.pdf","nt:file");
Node content = file.addNode("jcr:content","nt:resource");
Binary binary = session.getValueFactory().createBinary(stream);
content.setProperty("jcr:data",binary);
content.setProperty("jcr:mimeType","application/pdf");

现在，开箱即用，“nt:file”和“nt:resource”节点类型不允许您设置它们未定义的属性。但是您可以使用 mixins 来绕过这个限制，并将元数据直接存储在这些节点上。请参阅我在前面的其他问题上描述如何执行此操作的详细答案。

java - 将各种类型的文档（ods、ms office、pdf）保存到 Jackrabbit 存储库中

1 回答 1

Related

Reference