0

我有一个包含简历的巨大 XML 文件。该文件有两种格式,即一个包含所有简历的单个主文件

<Resumes>
  <Resume>
    <Name>ABC</Name>
    ......
    ......
  </Resume>
  <Resume>
    <Name>PQR</Name>
    ......
    ......
  </Resume>
  ......
  ......
</Resumes>

和多个文件用于 ex-

文件 1-

<Resumes>
  <Resume>
    <Name>ABC</Name>
    ......
    ......
  </Resume>
</Resumes>

文件-2

<Resumes>
  <Resume>
    <Name>PQR</Name>
    ......
    ......
  </Resume>
</Resumes>

等等。

我想使用baseXXML eXistDB 来存储 XML。因此,将来,如果我想 添加更多简历(以 XML 格式),那么哪一个会更好?

4

1 回答 1

2

对于 eXist-db,让我引用Wolfgang Meier在exist-open 上的一篇文章来回答类似的问题:

我认为没有理论上的限制,但肯定有一些实际的考虑。存储一个非常大的文档比存储许多小文档更能阻塞数据库。它需要单个事务(以及足够的磁盘空间用于事务日志)。

我用于一些自动化性能测试的 dblp 参考书目是一个超过 600mb 的文档。如果您稍微增加缓存大小和内存设置,这将很好地加载。我知道其他用户必须处理更大的文档(许多 GB),但是如果您有选择,我绝对会建议将您的数据拆分为更易于处理的小块。

诚然,自 2009 年 11 月 Wolfgang 撰写这篇文章以来,eXist-db 变得更加高效和强大,但我认为他的建议仍然适用。最后的两个注意事项:

  1. 确保您使用最新版本的 eXist,例如1.4.22.0 Tech Preview。这些受益于我所说的进步。

  2. 要发挥 eXist-db 的最大性能,请阅读 eXist-db 文档文章,标题为Performance Tuning

于 2012-04-29T00:03:56.377 回答