34

在 web 应用程序的上下文中,我的老老板总是说在数据库中放一个对图像的引用,而不是图像本身。我倾向于同意将 url 与图像本身存储在数据库中是一个好主意,但是我现在工作的地方,我们在数据库中存储了很多图像。

我能想到的唯一原因可能是它更安全?您不希望有人直接链接到网址吗?但如果是这种情况,您始终可以让网站/服务器处理图像,例如 asp.net 中的处理程序,以便用户需要进行身份验证才能查看图像。我还认为从数据库中提取图像会损害性能。将图像存储在数据库中可能是个好主意/不太好主意的任何其他原因?


完全重复: 用户图像:数据库或文件系统存储?
完全重复: 在数据库中存储图像:是还是不是?
完全重复: 我应该将图像存储在数据库还是文件夹中?
完全重复: 您会将二进制数据存储在数据库还是文件夹中?
完全重复: 将图片存储为文件或网络应用程序的数据库?
完全重复: 存储少量图像:blob 还是 fs?
完全重复: 将图像存储在文件系统或数据库中?

4

14 回答 14

53

将图像放入数据库的优点。

  1. 交易。保存 blob 时,您可以像提交任何其他数据库数据一样提交它。这意味着您可以将 blob 与任何关联元数据一起提交,并确保两者同步。如果磁盘空间不足?没有承诺。文件没有完全上传?没有承诺。愚蠢的应用程序错误?没有承诺。如果保持图像及其相关元数据彼此一致对您的应用程序很重要,那么数据库可以提供的事务可能是一个福音。

  2. 一个系统来管理。需要备份元数据和 blob?备份数据库。需要复制它们吗?复制数据库。需要从部分系统故障中恢复?重新加载数据库并向前滚动日志。DB 为一般数据带来的所有优势(卷映射、存储控制、备份、复制、恢复等)都适用于您的 blob。一致性更高,管理更轻松。

  3. 安全。数据库具有可以利用的非常细粒度的安全功能。模式、用户角色,甚至诸如“只读视图”之类的东西,以提供对数据子集的安全访问。所有这些功能也适用于保存 blob 的表。

  4. 集中管理。与 #2 相关,但基本上 DBA(好像他们没有足够的权力)可以管理一件事:数据库。现代数据库(尤其是大型数据库)在跨多台机器的大型安装中运行良好。单一管理来源简化了程序,简化了知识转移。

  5. 大多数现代数据库都可以很好地处理 blob。借助数据层中对 blob 的一流支持,您可以轻松地将 blob 从数据库流式传输到客户端。虽然您可以执行一些操作,但会一次性“吸入”整个 blob,但如果您不需要该工具,请不要使用它。研究数据库的 SQL 接口并利用其功能。没有理由将它们视为“大字符串”,它们被单独处理并将您的 blob 变成大的、内存吞噬、缓存粉碎的炸弹。

  6. 就像您可以为图像设置专用文件服务器一样,您可以在数据库中设置专用 Blob 服务器。给他们专用的磁盘卷、专用的模式、专用的缓存等。数据库中的所有数据都不相同,或者行为相同,没有理由将其配置为完全相同。好的数据库具有良好的控制水平。

从数据库中提供 blob 的主要任务是确保您的 HTTP 层实际上利用所有 HTTP 协议来执行服务。

许多幼稚的实现只是简单地抓取 blob,然后将它们全部倾倒到套接字中。但是 HTTP 有几个非常适合流式传输图像等的重要特性。特别是缓存标头、ETag 和分块传输以允许客户端请求 blob 的“片段”。

确保您的 HTTP 服务正确地处理所有这些请求,并且您的数据库可以成为一个非常好的 Web 公民。通过将文件缓存在文件系统中以供 HTTP 服务器提供服务,您可以获得“免费”的一些优势(因为一个好的服务器无论如何都会为“静态”资源做到这一点),但请确保如果您这样做,您尊重图像的修改日期等。

例如,有人请求 spaceshuttle.jpg,这是 2009 年 1 月 1 日创建的图像。最终在请求日期(例如 2009 年 2 月 1 日)缓存在文件系统上。之后,图像从缓存中清除(FIFO 策略, 或其他),然后有人在 2009 年 3 月 1 日再次请求它。好吧,现在它有一个 2009 年 3 月 1 日的“创建日期”,尽管它的创建日期实际上是 1 月 1 日。所以,你可以看到,特别是如果你的缓存经常转,客户端可能正在使用 If-修改后的标头可能会获得比实际需要更多的数据,因为服务器认为资源已更改,而实际上并未更改。

如果您将缓存创建日期与实际创建日期保持同步,则问题可能会更小。

但关键是,为了成为“优秀的网络公民”,需要仔细考虑整个问题,并为您和您的客户节省一些带宽等。

我刚刚为一个从数据库提供视频的 Java 项目完成了所有这些工作,这一切都是一种享受。

于 2009-05-02T23:26:47.803 回答
21

如果您有时需要检索图像并且它必须在多个不同的 Web 服务器上可用。但我认为差不多就是这样。

  • 如果它不必在多个服务器上可用,最好将它们放在文件系统中。
  • 如果它必须在多台服务器上可用并且系统中实际上存在某种负载,那么您将需要某种分布式存储。

我们在这里讨论的是一个边缘案例,您可以通过利用数据库来避免给您的系统增加额外级别的复杂性。

除此之外,不要这样做。

于 2009-05-02T21:16:23.890 回答
14

我知道如果您将图像存储在数据库中(甚至提到它),大多数数据库专业人员都会对您表示不满和嘶嘶声。是的,当使用数据库作为任何类型的大块二进制数据的存储库时,肯定会影响性能和存储(图像往往是最常见的无法标准化的数据位)。但是,在大多数情况下,图像的数据库存储不仅是允许的,而且是可取的。

例如,在我以前的工作中,我们有一个应用程序,用户可以在其中将图像附加到他们正在编写的报告的几个不同点,并且这些图像必须在完成后打印出来。这些报告是通过 SQL Server 复制移动的,如果尝试以任何可靠性跨多个系统和服务器管理这些图像和文件路径,将会带来巨大的麻烦。将它们存储在数据库中为我们“免费”提供了所有这些,并且报告工具不必进入文件系统来检索图像。

于 2009-05-02T21:28:43.237 回答
8

我的一般建议是不要将自己局限于一种方法或另一种方法——使用适合情况的技术。文件系统非常擅长存储文件,而数据库非常擅长根据请求提供一口大小的数据块。另一方面,我公司的一个产品要求将应用程序的整个状态存储在数据库中,这意味着文件附件也会存储在数据库中。使用我们的数据库服务器 (SQL Server 2005),即使是大型客户和数据库,我也没有遇到明显的性能问题。

Microsoft 的 SQL 2008 通过 FileStream 功能为您提供了两全其美的功能 - 可能值得一试。 http://technet.microsoft.com/en-us/library/bb933993.aspx

于 2009-05-02T21:18:32.167 回答
7

将图像存储到数据库的优点之一是它可以跨系统移植并且独立于文件系统布局。

于 2009-05-02T21:14:06.187 回答
6

最简单/最高性能/最具可扩展性的解决方案是将图像存储在文件系统上。如果需要考虑安全性,请将它们放在 Web 服务器无法访问的位置,并编写一个脚本来处理安全性并提供文件。

假设您的 Web/应用服务器和 DB 服务器是不同的机器,您将图像放入 DB 会受到一些影响:(1) 两台机器之间的网络延迟,(2) DB 连接开销,(3) 消耗额外的 DB提供的每个图像的连接。我会更关心最后一点:如果您的站点提供大量图像,您的 Web 服务器将消耗许多数据库连接并可能耗尽您的连接池。

于 2009-05-02T21:13:23.803 回答
5

如果您的应用程序在多台服务器上运行,我会将您的图像的参考副本存储在数据库中,然后根据需要将它们缓存在文件系统上。与尝试横向同步文件系统相比,这样做更不容易出错。

如果您的应用程序位于单个服务器上,那么是的,请坚持使用文件系统并让数据库维护数据的路径。

于 2009-05-02T21:16:27.120 回答
3

大多数 SQL 数据库当然在设计时并没有考虑到提供图像,但是将它们放在数据库中会带来一定的便利。

例如,如果您已经有一个数据库正在运行并配置了复制。您立即拥有一个 HA 映像存储,而不是尝试进行一些基于 rsync 或 nfs 的文件系统复制。此外,拥有一堆 Web 进程(或设计一些新服务)来将文件写入磁盘会稍微增加您的复杂性。真的,它只是更多的活动部分。

至少,我建议将有关图像的“元”数据(例如任何权限、谁拥有它等)和实际数据分开到不同的表中,这样可以很容易地切换到不同的数据存储线。再加上某种 CDN 或缓存应该可以在一定程度上为您提供相当不错的性能,所以我认为这取决于该应用程序需要的可扩展性以及您如何在易于实现的情况下平衡它。

于 2009-05-02T22:37:12.650 回答
2

您不必存储 URL(如果您觉得这不安全)。您可以只存储一个在其他地方引用图像的唯一 ID。

数据库存储往往比文件系统更昂贵且维护成本更高——因此我不会在数据库中存储大量图像。

于 2009-05-02T21:12:46.673 回答
1
  • 数据数据库
  • 文件的文件系统
于 2009-05-02T21:32:00.467 回答
1

当您在数据库中存储 TB 的图像数据时,灾难恢复绝对没有乐趣。您最好找到一种更好的方法来分发数据以使其更可靠等......当然,复制时所有的开销(上面提到的)都会成倍增加等等......

只是不要这样做!

于 2009-05-02T22:40:09.960 回答
1

这看起来真的像一个 KISS(保持简单愚蠢)问题。文件系统是为了方便处理图片文件的存储而设计的,但在数据库中做起来并不容易,而且容易弄乱数据。当您只需担心文件安全性时,为什么还要在 sql 和渲染中遇到性能损失和所有困难?您还可以使用 NFS 或 CIFS 处理混合系统。文件系统是成熟的技术。更简单,更健壮。

于 2009-05-02T22:55:14.447 回答
1

我将图像存储在数据库中以用于演示应用程序。我这样做的原因是安全 - 删除我不应该删除的记录不是一个大问题,但删除我不应该删除的文件可能是个问题!

如果性能成为问题,我会调查流氓文件删除是否真的有可能。

于 2009-05-03T03:07:37.710 回答
1

如果是定期从数据库中提取的图像,我总是会尝试使用文件系统。

如果是需要偶尔拉出的图像,并将它们保存在数据库中会使生活更轻松,我对此完全没有问题。

于 2009-05-04T11:36:36.793 回答