我一直试图找出将数据从 HDFS 移植到 SQL Server 的最佳方法。
- 我是使用 SQL Server 2008 R2 的 sqoop Hadoop 连接器从 Cloudera Hadoop 导入数据还是
- 我是否使用 sqoop 将 Cloudera Hadoop 中的数据导出到 SQL Server
根据我阅读的大量链接,我确信两者都是可能的
- http://www.cloudera.com/blog/2011/10/apache-sqoop-overview/
- http://www.microsoft.com/en-in/download/details.aspx?id=27584
但是当我在寻找可能在配置和维护级别上升的问题时,我没有正确的答案。
我强烈认为我应该进行导入,但我对排除和维护时不时出现的问题感到不舒服。
有人可以分享他们对什么是最好的想法吗?