我特别感兴趣的是如何为谷歌搜索或谷歌地图等商业服务处理大量信息。我们都知道他们使用(或至少“做过”)一种 Linux 集群,但它们究竟是如何组织的呢?他们使用什么样的硬件,什么文件系统,网络,最常见的问题是什么?
问问题
162 次
1 回答
1
答案取决于你想要做什么。谷歌创建了自己的分布式数据库,还创建了自己的计算农场和许多其他东西。一旦您决定走同样的路,就没有简单的决定要做什么,但可以肯定的是,您将需要数百万美元的基础设施和开发投资。马修在评论链接中提供了关于谷歌所做的事情的数学。
但是,如果您的目标是创建 Web 应用程序,那么您可能不想花时间自己创建基础设施,而是使用市场上已有的东西。如果您想创建能够处理每小时为数百万客户服务的海量数据的应用程序,那么您绝对应该考虑像 Amazon Elastic Computing Cloud 和 Microsoft Azure 这样的云基础设施。
优点是您可以以合理的价格获得具有已实施数据库应用程序和即时可扩展性的大型计算场,并且没有与之相关的 IT 成本。当需求高峰过去时,您可以立即将其从一台服务器扩展到一百台,然后再恢复到一台。
这里是亚马逊弹性计算云的描述:http: //aws.amazon.com/ec2/
以下是对其可扩展数据库服务的描述:http: //aws.amazon.com/simpledb/ http://aws.amazon.com/rds/
于 2010-08-11T12:33:22.837 回答