我正在构建一个非常大的计数器系统。需要明确的是,系统正在计算域在数据流中出现的次数(大小约为 50 到 1 亿个元素)。
系统将单独处理每个元素并发出数据库请求以增加该域的计数器及其处理日期。这是结构:
stats_table (or collection)
-----------
id
domain (string)
date (date, YYYY-MM-DD)
count (integer)
我最初的想法是使用 MongoDB,因为它们具有原子计数器功能。然而,当我想得更多时,我认为 Postgres 更新已经自动发生(至少这是这个问题让我相信的)。
我的问题是:在这里使用一个数据库比另一个数据库有什么好处吗?假设我每天要处理大约 500 万个域,我需要在这里考虑哪些关键事项?