1

任何人都可以将示例代码从 mongodb 提供给 rdbs ...我已经尝试过,从 mongodb 获取数据并将输出存储在 mongodb 中。为此,我知道如何在 java 作业中进行 hadoop 配置。

我想知道三件事...

  1. 哪个hadoop版本同时支持mongodb和rdbs?
  2. 是否可以使用多个集合作为输入...?如果可能的话,我们怎么能做到这一点?
  3. 我在hadoop中尝试了mongodb查询,它工作正常。但是当我定义排序或限制时......它不能正常工作..即使它没有从mongodb获取数据......
4

1 回答 1

1
1. which hadoop version support both mongodb and rdbs?

我相信所有支持 MongoDB 的 Hadoop 版本也支持 RDBMS(RDBMS 实现早于 MongoDB)。

有关与 MongoDB 一起使用的受支持的 Hadoop 版本,请参阅:构建适配器。检查版本信息,因为某些 Hadoop 版本不支持 Streaming Connector(即,如果您想用 Python 等非 JVM 语言编写作业)。

2. Is it possible to use multiple collections as input...?
If possible, how we can do that?

MongoDB Hadoop 连接器 v1.0.0 不支持多个集合作为输入,但社区中有一些人正在研究这个(请参阅:功能/多个输入)。

3. I tried mongodb query in hadoop,It's working fine. But when i defined
sort or limit... It is not working properly..even it's not fetching data
from mongodb...

您能否举例说明您如何/在何处提供这些选项?你指的是mongo.input.sortmongo.input.limit属性吗?

您可能想尝试在 MongoDB 中启用Database Profiler以确认正在发送查询:

 db.setProfilingLevel(2) 
于 2012-09-04T00:58:27.350 回答