我已经在我的电脑中安装了 Hortonworks SandBox。还尝试使用 CSV 文件并以表结构方式获取它的 OK(Hive + Hadoop),nw 我想将我当前的 SQL 数据库迁移到沙箱(MS SQL 2008 r2)。我将如何做到这一点?还想连接到我的项目(VS 2010 C#)。
是否可以通过 ODBC 连接?
我听说 sqoop 用于将数据从 SQL 传输到 Hadoop,那么我如何使用 sqoop 进行此迁移?
我已经在我的电脑中安装了 Hortonworks SandBox。还尝试使用 CSV 文件并以表结构方式获取它的 OK(Hive + Hadoop),nw 我想将我当前的 SQL 数据库迁移到沙箱(MS SQL 2008 r2)。我将如何做到这一点?还想连接到我的项目(VS 2010 C#)。
是否可以通过 ODBC 连接?
我听说 sqoop 用于将数据从 SQL 传输到 Hadoop,那么我如何使用 sqoop 进行此迁移?
您可以编写自己的作业来迁移数据。但是 Sqoop 会更方便。为此,您必须下载Sqoop 和适当的连接器,在您的情况下是 Microsoft SQL Server Connector for Apache Hadoop。您可以从这里下载。请阅读Sqoop 用户指南。它包含适当详细的所有信息。
Hive 确实支持 ODBC。您可以在此页面上找到更多信息。
我写下了在 Hortonworks Sandbox 中安装 JDBC 驱动程序并使其工作所需的步骤:http: //hortonworks.com/community/forums/topic/import-microsoft-sql-data-into-sandbox /
要在 C# 项目中连接到 Hadoop,您可以使用来自http://hortonworks.com/thankyou-hdp13/#addon-table的 Hortonworks Hive ODBC 驱动程序。阅读 PDF(也在该页面上)以了解它是如何工作的(我使用Hive Server Type 2和用户名sandbox)