I need to consider a database to store large volumes of data. Though my initial requirement is to simply retrieve chunks of data and save them in excel file, I am expecting more complex use cases for this data in future where the data will be consumed by different applications especially for analytics - hence need to use aggregated queries.

I am open to use either cloud based storage or on-premises storage. I am considering azure storage table (when there is a need to use aggregated data, I can have a wrapper service + cache around azure table storage but eventually will end up with nosql type storage) and on-premises MongoDB. Can someone suggest pros and cons of saving large data in azure table storage Vs on-premises MongoDB/couchbase/ravendb? Cost factor can be ignored.


1 回答 1



这实际上将是一个特定于应用程序的架构问题,涉及延迟和带宽,以及维护本地服务器和其他资源的需要。在本地,您将完全控制您的硬件资源,但如果您从云端对您的数据库进行大量查询,您的性能将受到延迟和带宽的阻碍。如果设置在同一个数据中心,基于云的存储(无论是在 MongoDB 还是任何其他数据库中)将具有与您的应用程序相邻的优势。

请记住:任何持久性数据库存储都需要在 Azure 存储中备份其数据,这意味着由 Blob 存储支持的已装载磁盘。您需要处理每个磁盘 1TB 的大小限制(通过条带在 8 核机器上扩展到 16TB),并且您需要将其与您的存储需求进行比较。如果您需要超过 16TB,则需要分片、使用 200TB 表存储或使用本地 MongoDB。但是...... MongoDB 和表存储是两种不同的野兽,一种是基于文档的,专注于查询强度,另一种是具有非常高速离散查找的键/值存储。在本地与云的概念上比较两者是次要的(在我看来),而不是比较与您的应用程序相关的功能。

于 2013-11-12T16:05:59.003 回答