实际上,我正在使用一个大数据环境,我在其中使用 Apache Nifi 摄取和处理数据。结果保存在 HBase 表中,我想使用 Hive 访问存储的数据。现在我想设置一个 REST 服务来读取 HBase 表。例子
获取http://localhost:50111/userid/42 --> http-response { "userid": 42, "name": "foobar" }
我认为这是现有解决方案的标准问题,但事实并非如此。问题是,我无法将结果作为 http-response 发送。
首先,我尝试使用 Nifi 并且 Web 服务正在运行,但仅限于静态内容,例如“200 OK”或“404 Not found”。所以我在没有Nifi的情况下尝试它。我读到,每个人都在说,WebHCat 是要使用的工具,因为它是 Hive 的 REST API 工具。伟大的!但是......同样的问题:我可以在 HBase 上使用 WebHCat 和 Hive 通过 REST 服务执行查询,但是没有选项可以检索结果。
以我目前的知识,没有现成的解决方案,我必须开发自己的 REST 服务。正确的?真的?!
我是否必须开发自己的 REST 服务,或者在这种情况下最佳实践是什么?尼菲?蜂巢服务器2?此外,我想使用 Knox 和 Ranger 保护 REST 服务。
我希望有人可以帮助我并向我展示正确的(!)方法,因为如果有更好或最佳实践解决方案,我不想制作新的和特别的东西。
谢谢~n3