1

我正在读取某些文件组的文件流并将其作为bytea类型存储在数据库中。但是当我尝试从数据库中读取流并将这些流写入文件时,确实需要很长时间才能完成,最后我得到了内存不足的异常。在涉及或不涉及数据库的情况下,是否有任何其他选择可以更有效地完成?

4

1 回答 1

4

数据库的设计考虑了一个关键问题:

When having a bunch of data, where we don't know the kinds of reports
that will be generated, how can we store the data in a manner that
preserves the data's inner relationships and permits any reporting
format we can think of. a

文件缺少数据库的一些关键特征。文件始终具有“按顺序排列的字符”的单一结构。他们还缺乏任何集成报告构建的方法,并且报告通常仅限于简单的搜索,这些搜索几乎没有上下文,结果不会显示在文件的其余部分中。

简而言之,如果您不使用数据库的功能,请不要使用数据库。

许多人确实将文件存储在数据库中。因为,他们有一个方便的,而不是编写对文件系统存储的支持,他们剪切和粘贴数据库存储代码。让我们探讨一下后果:

  1. 备份和恢复变得有问题,因为数据库的大小增长非常快,并且执行备份和恢复的带宽是数据库大小的函数。
  2. 故障安全数据库中的复制重建需要更长的时间(我见过一些时间太长以至于冗余无法赶上主数据库的变化率)。
  3. (意外)批量引用文件的查询会占用 CPU,可能会导致无法访问系统的其余部分(取决于数据库)。
  4. 返回这些查询结果的带宽会窃取系统资源,从而阻止其他查询传达其结果(在某些数据库上更好,在其他数据库上更糟)。
于 2018-04-07T12:26:05.970 回答