3

所以我正在收听最新的 Stackoverflow 播客(第 19 集),Jeff 和 Joel 谈到了随着网站的发展而扩展服务器硬件。根据 Joel 的说法,前几个步骤非常标准:

  1. 一台同时运行网络服务器和数据库的服务器(当前的 Stackoverflow 设置)
  2. 一台网络服务器和一台数据库服务器
  3. 两台负载平衡的网络服务器和一台数据库服务器

不过,他们并没有过多谈论接下来会发生什么。你添加更多的网络服务器吗?另一个数据库服务器?在不同的数据中心复制这个三机集群以实现冗余?硬件部门的网络创业公司从何而来?

4

6 回答 6

10

支持“普通”Web 应用程序的合理设置可能会演变如下:

  1. 单一组合应用程序/数据库服务器
  2. 不同机器上的独立数据库
  3. 第二个使用 DNS 循环(可怜的负载平衡)的应用服务器,或者,例如Perlbal
  4. 其次,复制数据库服务器(对于读取负载,需要一些应用程序逻辑更改,以便合格的数据库读取转到从属服务器)

在这一点上,评估当前的事态将有助于确定更好的扩展路径。例如,如果读取负载很高且内容不经常更改,则最好强调缓存并引入专用的前端缓存,例如Squid以避免不必要的数据库读取,尽管您需要考虑如何保持缓存一致性,通常在应用程序中。

另一方面,如果内容经常发生合理的变化,那么您可能会更喜欢更分散的解决方案;引入更多的应用程序服务器和数据库从属服务器以帮助减轻影响,并使用对象缓存(例如memcached)来避免访问数据库以获取不那么易变的内容。

对于大多数站点来说,这可能就足够了,尽管如果您确实成为了一种全球现象,那么您可能会开始考虑在区域数据中心安装硬件,并使用诸如地理负载平衡之类的技巧将访问者引导到最近的“集群” ”。到那时,你可能会雇佣到真正能对事物进行微调的工程师。

可能我能想到的最有价值的扩展建议是避免过早地担心它;专注于开发人们想要使用的服务,并使应用程序相当健壮。一些简单的早期优化是确保您的数据库设计相当可靠,并设置索引,这样您就不会做任何痛苦而疯狂的事情;此外,确保应用程序发出缓存控制标头,指导浏览器如何缓存数据。在设计的早期进行此类工作可以在以后产生好处,尤其是当您不必重新设计整个事情来处理缓存一致性问题时。

我要提出的第二条最有价值的建议是,您不应该假设适用于其他网站的方法也适用于您。检查您的日志,对您的流量进行一些分析并分析您的应用程序 - 查看您的瓶颈所在并解决它们。

于 2008-08-31T01:36:08.150 回答
3

很多鱼建筑

一些有趣的视频:

Youtube 可扩展性

采访 Myspace 系统架构师 Dan Farino

于 2008-12-16T23:10:49.973 回答
2

Joel 提到添加第二个数据中心,设置相同,然后将用户随机分配给每个数据中心。记录对数据的更改并将其从一个位置发送到另一个位置,以便两个位置都包含所有数据。

于 2008-08-31T01:18:36.303 回答
1

Cal Henderson (Yahoo) 在 Web 2.0 Expo 上的 Scalable Web Architectures Common Patterns & Approaches 演讲非常有趣。我以为有视频,但我找不到。但这里是幻灯片:

http://www.slideshare.net/techdude/scalable-web-architectures-common-patterns-and-approaches

于 2008-08-31T01:20:33.660 回答
1

下一步将是一个网络服务器集群(一个网络农场)和一个数据库服务器集群系统(复制或 Oracle RAC 等)。

于 2008-08-31T01:21:09.980 回答
0

如果您对缓存和使用 .Net 感兴趣,请查看企业库中的应用程序缓存块(当然与上述其他点一起使用)。

于 2010-03-04T10:54:30.200 回答