问题标签 [sqoop]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
import - Sqoop 的增量类型 lastmodified 不做增量导入
我正在使用 Sqoop v1.4.2 对作业进行增量导入。这些职位是:
--create job_1 -- import --connect <CONNECT_STRING> --username <UNAME> --password <PASSWORD> -m <MAPPER#> --split-by <COLUMN> --target-dir <TARGET_DIR> --table <TABLE> --check-column <COLUMN> --incremental append --last-value 1
笔记:
- 增量类型是追加
- 就业创造成功
- 作业执行多次成功
- 可以看到在 HDFS 中导入的新行
--create job_2 -- import --connect <CONNECT_STRING> --username <UNAME> --password <PASSWORD> -m <MAPPER#> --split-by <COLUMN> --target-dir <TARGET_DIR> --table <TABLE> --check-column <COLUMN> --incremental lastmodified --last-value 1981-01-01
笔记:
- 增量类型是 lastmodified
- 作业创建成功,表名与job_1中使用的不同
- 作业执行仅第一次成功
- 可以看到为在 HDFS 中首次执行而导入的行
后续作业执行失败并出现以下错误:
/li>
hdfs - “YYYYMMDD”:尝试通过 SQOOP 时出现无效标识符错误
请帮助我解决以下错误。在 oracle 中检查时工作正常,但在尝试通过 SQOOP 导入时失败。
版本:Hadoop 0.20.2-cdh3u4 和 Sqoop 1.3.0-cdh3u5
错误:
12/10/10 09:33:21 ERROR manager.SqlManager: Error execution statement: java.sql.SQLSyntaxErrorException: ORA-00904: "YYYYMMDD": invalid identifier
其次是....
2010 年 12 月 10 日 09:33:21 错误 sqoop.Sqoop:运行 Sqoop 时出现异常:java.lang.NullPointerException
感谢和问候,
泰米尔语
sqoop - Apache Sqoop 通信链路故障
当我在一个集群aaaaaa1
(aaaaaa2
请帮助我确定导致此问题的原因。谢谢!
mysql - 将 HBase 表导出到 mysql
我正在使用 hbase-0.90.6。我想将数据从 HBase 导出到 mysql。我知道两步过程,首先通过运行 mapreduce 作业将 Hbase 数据拉入平面文件,然后将平面文件数据导出到 mysql。
他们是我可以用来将这两个步骤减少到一个的任何其他工具吗?或者我们可以使用 sqoop 一步完成。谢谢。
sql-server - 从由 sqoop 导入创建的 hive 表中导出 sqoop
我已经使用 Cloudera CDH4.1 上的 SQOOP 成功地将一个简单的 2 列 SQL Server 数据导入 HIVE。- id (int) - 描述 (varchar(50))
当我尝试让同一个 HIVE 表返回到 SQL Server 时,它会将两列合并在一起,因此会创建一个 NumberFormatException。
我已经尝试了 --fields-terminated by \t --lines-terminated-by \n 但这没有任何区别。
我还尝试导出 Cloudera 提供的 sample_08 Hive 表,但得到 NoSuchElement 异常。希望它能给出它认为不存在的元素的线索!
我确保表结构和字段名称在两边都相同,包括大小写和下划线。
我可以导出一个单列表,但对于如何解决这个问题绝对感到困惑。
任何帮助将不胜感激。
sql-server - Sqoop 自由形式查询按别名拆分
我想将数据从 MsSQL 导入到 HBase,运行一个自由形式的查询,该查询在我想要拆分的键上有一个别名。例如我的查询是:
我想按这个别名字段拆分工作单元。所以,在我的 sqoop 查询中,我可以--split-by 'xyz'
选择。但是,这行不通。我得到:
那么,我怎样才能让 sqoop 使用这个别名选择字段呢?
mysql - 如何将大型mysql转储导入hadoop?
我需要将维基百科转储(mysql 表,解压文件大约需要 50gb)导入 Hadoop(hbase)。现在首先我将转储加载到 mysql 中,然后将数据从 mysql 传输到 hadoop。但是将数据加载到 mysql 需要大量时间 - 大约 4-7 天。是否可以将mysql转储直接加载到hadoop(通过一些转储文件解析器或类似的东西)?
hadoop - Fedora 15上的sqoop安装错误
我正在尝试在我的机器上安装 sqoop,我从这里下载了 tar 文件
并尝试通过查看here来安装
所以当我尝试下面的命令时,我得到如下错误
错误
上面的命令有什么问题?
谁能告诉我安装 sqoop 的最简单方法?
实际上我有一个1GB xml
需要处理并保存到 MYSQL 数据库中的文件,我使用 hadoop 和 python 来执行此操作,但它需要hrs
处理和保存,所以我决定使用 sqoop 并处理 xml 文件并将数据保存在到数据库
另外请让我知道使用 sqoop 的基本且简单的教程
另外请提供一个基本代码来处理 xml 文件并将数据保存到数据库中,因为我是 sqoop 的新手。
hadoop - 如何在 AS/400 服务器和 Hadoop 之间建立连接并移动数据?
如何从 AS/400 服务器上的 db2 获取数据/表到 Hadoop 文件系统?如何在 AS/400 服务器和 Hadoop 文件系统之间建立连接?
我知道我们可以使用 SQOOP 从 MySQL 服务器数据获取数据/表到 Hadoop 文件系统。
hadoop - Sqoop 导出到超过 64 MB 的 RDBMS .lzo .gz 文件加载重复项
使用 sqoop 1.3
尝试将 hdfs 输出导出到 mysql 表
加载大小超过 300MB 的未压缩文件时,一切正常
但是在加载大小为 75 MB 或 79 MB 的压缩文件(.gz 和 .lzo)时,我看到加载到表中的行数增加了一倍。当压缩文件的大小为 60MB 或更小(猜测与 64 MB 相关的块大小)时,不会发生这种情况。我在上述情况下所做的一些操作: