我的公司开始使用 mongo,我们开始思考从 mongodb 中提取数据并将其发送到我们的数据仓库的最佳方法是什么。
我的问题集中在过程的提取部分。正如我所看到的,最好的方法是在构建于 mongo 之上的服务上公开 API,ETL 过程(由数据仓库中的作业调用)将执行一些特定的查询,这些查询可能会查询对于一组时间(即 - 每条记录的开始日期和结束日期)。
这听起来对还是我错过了一些东西,或者也许有比这更好的方法?
最初我正在考虑每隔 X 持续时间做一次 mongoexport,但根据文档,它的性能似乎不太好。
提前致谢!