0

我的公司开始使用 mongo,我们开始思考从 mongodb 中提取数据并将其发送到我们的数据仓库的最佳方法是什么。

我的问题集中在过程的提取部分。正如我所看到的,最好的方法是在构建于 mongo 之上的服务上公开 API,ETL 过程(由数据仓库中的作业调用)将执行一些特定的查询,这些查询可能会查询对于一组时间(即 - 每条记录的开始日期和结束日期)。

这听起来对还是我错过了一些东西,或者也许有比这更好的方法?

最初我正在考虑每隔 X 持续时间做一次 mongoexport,但根据文档,它的性能似乎不太好。

提前致谢!

4

2 回答 2

0

我正在使用 Alteryx 设计器通过专用连接器从 MongoDB 中提取数据,并准备我的数据以加载到 Tableau 中,中间有可选的数据准备。效果很好!虽然 ALteryx 可以写入大多数数据库...

于 2015-02-27T20:05:25.893 回答
0

试试pentaho水壶。

https://anonymousbi.wordpress.com/2012/07/25/creating-pentaho-reports-from-mongodb/

于 2013-06-17T18:31:47.820 回答