4

我已经在我的电脑中安装了 Hortonworks SandBox。还尝试使用 CSV 文件并以表结构方式获取它的 OK(Hive + Hadoop),nw 我想将我当前的 SQL 数据库迁移到沙箱(MS SQL 2008 r2)。我将如何做到这一点?还想连接到我的项目(VS 2010 C#)。

是否可以通过 ODBC 连接?

我听说 sqoop 用于将数据从 SQL 传输到 Hadoop,那么我如何使用 sqoop 进行此迁移?

4

2 回答 2

1

您可以编写自己的作业来迁移数据。但是 Sqoop 会更方便。为此,您必须下载Sqoop 和适当的连接器,在您的情况下是 Microsoft SQL Server Connector for Apache Hadoop。您可以从这里下载。请阅读Sqoop 用户指南。它包含适当详细的所有信息。

Hive 确实支持 ODBC。您可以在此页面上找到更多信息。

于 2013-06-12T13:19:04.433 回答
1

我写下了在 Hortonworks Sandbox 中安装 JDBC 驱动程序并使其工作所需的步骤:http: //hortonworks.com/community/forums/topic/import-microsoft-sql-data-into-sandbox /

要在 C# 项目中连接到 Hadoop,您可以使用来自http://hortonworks.com/thankyou-hdp13/#addon-table的 Hortonworks Hive ODBC 驱动程序。阅读 PDF(也在该页面上)以了解它是如何工作的(我使用Hive Server Type 2和用户名sandbox

于 2013-06-28T09:29:56.770 回答