我正在使用一项 3rd 方服务,它聚合数据并公开 REST API 以访问它。
我现在正在尝试获取这些数据并将其加载到我们的本地 HBase 集群上。我创建了一个 java 应用程序,它从该 3rd 方服务中获取数据,对其进行处理并使用 HBase 客户端 API 将其加载到我们的集群上。对于这个应用程序,我必须手动运行它,并且不确定有多少 HBase 客户端 API 可以有效地加载批量数据。
我遇到了 Sqoop 和 Cascading-dbmigrate 从 RDBMS 进行批量传输。我的问题是:是否有任何类似的工具可以从 REST API 进行批量数据传输?另外,定期同步数据。
感谢 ArunDhaJ http://arundhaj.com