0

我选择了存储在特定标记标准中的文件,这些文件组合起来构成了整个文本量。该文本有多种不同的语言版本,并且每个文件都针对该语言进行了复制。

为了通过 Web 应用程序存储、检索然后向潜在的大量用户显示该信息,我需要实现最合适的方法。目前我的思路是:

将文件转换为 XML(标记语言旨在使这很容易),然后在用户想要查看该部分时加载相关文件。我正在使用 Rails 和 Ember.js 来显示结果,因此(我认为)要求数据采用 JSON 格式。

我的问题是:

我应该将 XML 转换为 JSON 并将其存储在文件中,还是每次请求时都转换 XML 更好?我应该将数据存储在文件中还是应该将它们移动到数据库中?鉴于文本的每个部分都可以有脚注和其他参考,如果我沿着数据库路线走,对于每种语言,将每个部分存储为表中的一个字段会更好吗?还是每种语言都应该有自己的表格?我是否应该进一步分解并为一种语言中的每个部分提供一个表格,然后该表格包含段落、脚注、参考等字段?

我正在寻找实现这一点的最佳方法的答案,而不是能够实现它的实际方法。谢谢。

4

1 回答 1

0

我使用eXist来存储 XML 文档,它对我来说效果很好。它是一个 XML 数据库,允许您存储 XML 文档并通过 XPATH 和 XQUERY 查询它们。还有一些用于基于文本的搜索的 Lucene 集成。如果您正在考虑存储 XML,您可能需要研究一下。

于 2012-06-08T17:24:07.217 回答