3

所以我正在用 Java 构建博客引擎的后端,我在设计引擎时遇到的第一个问题是“将段落保存到 Java 字符串中是最好的方法吗?” 在考虑如何存储博客条目的文本正文可能具有的文本段落时。

目前,我的博文只有文字,所以不用担心图片和视频等其他媒体。

但是,使用字符串来存储博客条目的正文是个好主意吗?

我的引擎有一个 BlogEntry 类,它存储博客条目的各种特征,例如博客的作者、标题和正文。我使用字符串作为作者和标题只是因为这些字符串不会太长。显然,如果每个博客条目的正文只是一两句话,我使用 Java String 是没有问题的。但是这些博客条目可以是多段令人难以置信的长句子!那么要处理大量博客条目的文本,我应该远离使用 Java String 吗?使用文件之类的东西来存储博客条目的文本对我来说会更好吗?

请注意:当我说“更好”时,我指的是可维护性、良好实践以及可能的时间复杂度。我对“更好”的定义基本上是“这是实现这个的好方法吗?专业程序员会看到这个并喜欢我是如何实现的吗?其他使用这个引擎的程序员是否能够轻松使用和理解这个实现?”

让我知道我是否可以澄清其他任何事情。谢谢!

编辑:我试图根本不使用数据库,并且我计划在每次程序关闭之前将我的博客条目保存到一个文件中。因此,我会将博客的文本存储为字符串,并将 BlogEntry 本身保存为文件以供进一步使用。

4

1 回答 1

3

在 Java 中,字符串的最大长度为 2.147.483.647 个字符。即使每个字符编码简单 1 个字节,也超过 2GB。这应该足以容纳其中的任何纯文本文档。

如果您有大型文档(超过几 MB),那么在达到字符串限制之前很久,您就会遇到必须首先解决的其他问题。例如可用性问题、带宽限制或渲染性能。

此外,“字符串与文件”听起来不像是在比较正确的东西。也许您最好问“内存中与持久性”。将字符串存储在内存中很好 - 如果您不在乎是否丢失它们。Web 应用程序通常会永远运行,当它们停止时是因为应用程序或服务器崩溃或必须关闭以进行维护 - 在任何一种情况下,所有内存中的字符串都将丢失。您绝对应该尽快坚持下去。如果需要,您仍然可以保留内存中的副本,如果您担心性能,可以将其用作缓存。

或者您的问题可能与“数据库与文件”有关。但即使是这样的比较也不完全正确,因为也有基于文件的轻量级数据库和内存数据库。无论如何,常见的方法是使用数据库。我希望像您这样的系统只在极少数情况下使用文件,例如可以直接下载的文档。

于 2015-02-15T15:16:54.800 回答