5

正如我们过去所做的那样,我想为每个转向负载平衡的人收集有用的信息,因为您的代码必须注意一些问题

我们从一个 apache 服务器转移到 squid 作为反向代理/负载均衡器,后面有三个 apache 服务器。

我们使用的是 PHP/MySQL,所以问题可能会有所不同。

我们必须解决的问题:

会话

我们从“默认”php 会话(文件)转移到分布式 memcached-sessions。简单的解决方案,必须完成。这样,您也不需要负载均衡器上的“粘性会话”。

缓存

对于每个 Web 服务器的非分布式 apc-cache,我们添加了另一个用于分布式对象缓存的 memcached-layer,并用它替换了所有旧的/过时的文件缓存系统。

上传

上传到共享 (nfs) 文件夹。

我们为速度优化的事情:

静态文件

我们的主 NFS 运行一个 lighttpd,提供(也是用户上传的)图像。Squid 意识到了这一点,并且从不向我们的 apache 节点查询图像,这极大地提高了性能。Squid 还被配置为将这些文件缓存在 ram 中。

你做了什么来让你的代码/项目为负载平衡做好准备,考虑这一举措的人们是否有任何其他顾虑,以及你使用的是哪种平台/语言?

4

1 回答 1

1

这样做时:

对于 http 节点,我努力争取单个系统映像(ocfs2 对此很有用),并根据场景使用磅或十字路口作为负载平衡器。节点应该有一个小的本地磁盘用于交换并避免大多数(但不是全部)CDSL 的麻烦。

然后我将 Xen 加入其中。如果您在 Xenbus 上放置少量的临时信息(即 Linux 实际承诺处理每个 VM aka Committed_AS 的虚拟内存量),您可以快速检测到脑死负载平衡器并对其进行调整。Oracle 也注意到了这一点……现在正在努力改进 Linux 中的气球驱动程序。

之后,我查看了将任何给定应用程序的数据库使用拆分到 sqlite3 和应用程序本机所需的任何数据库的成本,同时意识到我需要拆分数据库,以便 posix_fadvise() 可以完成它的工作,而不会不必要地污染内核缓冲区。由于大多数 DBMS 服务都希望自己进行缓冲,因此您还必须让它们自己进行集群。这确实决定了我使用的数据库集群的类型以及我对气球驱动程序所做的事情。

然后,Memcache 服务器从一个精简的 initrd 启动,而特权域再次监视它们的内存和 CPU 使用情况,因此它知道何时启动更多。

心跳/接管的选择实际上取决于给定的网络和集群的预期使用情况。很难一概而论。

最终结果通常是 5 或 6 个物理节点,具有相当多的内存来启动虚拟机监视器 + 来宾,同时连接到镜像存储。

存储也很难笼统地描述。有时我使用集群 LVM,有时不使用。当 LVM2 最终摆脱其当前基于字符串的 API 时,这种情况不会改变。

最后,所有这些协调都会导致像Augeas那样基于通过 Xenbus 通信的事件即时更新配置。这包括 ocfs2 本身,或任何其他配置不能驻留在单个系统映像上的服务。

这真的是一个特定于应用程序的问题..你能举个例子吗?我喜欢 memcache,但并不是每个人都能从使用它中受益,例如。我们是在审查您的配置还是在讨论一般的最佳实践?

编辑:

很抱歉如此以 Linux 为中心……它通常是我在设计集群时使用的。

于 2009-03-03T09:14:51.393 回答