2

I need to consider a database to store large volumes of data. Though my initial requirement is to simply retrieve chunks of data and save them in excel file, I am expecting more complex use cases for this data in future where the data will be consumed by different applications especially for analytics - hence need to use aggregated queries.

I am open to use either cloud based storage or on-premises storage. I am considering azure storage table (when there is a need to use aggregated data, I can have a wrapper service + cache around azure table storage but eventually will end up with nosql type storage) and on-premises MongoDB. Can someone suggest pros and cons of saving large data in azure table storage Vs on-premises MongoDB/couchbase/ravendb? Cost factor can be ignored.

4

1 回答 1

1

我怀疑这个问题最终可能会因为它的广泛性和收集更多意见而不是事实的潜力而结束。那说:

这实际上将是一个特定于应用程序的架构问题,涉及延迟和带宽,以及维护本地服务器和其他资源的需要。在本地,您将完全控制您的硬件资源,但如果您从云端对您的数据库进行大量查询,您的性能将受到延迟和带宽的阻碍。如果设置在同一个数据中心,基于云的存储(无论是在 MongoDB 还是任何其他数据库中)将具有与您的应用程序相邻的优势。

请记住:任何持久性数据库存储都需要在 Azure 存储中备份其数据,这意味着由 Blob 存储支持的已装载磁盘。您需要处理每个磁盘 1TB 的大小限制(通过条带在 8 核机器上扩展到 16TB),并且您需要将其与您的存储需求进行比较。如果您需要超过 16TB,则需要分片、使用 200TB 表存储或使用本地 MongoDB。但是...... MongoDB 和表存储是两种不同的野兽,一种是基于文档的,专注于查询强度,另一种是具有非常高速离散查找的键/值存储。在本地与云的概念上比较两者是次要的(在我看来),而不是比较与您的应用程序相关的功能。

于 2013-11-12T16:05:59.003 回答