问题标签 [hcatalog]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1867 浏览

hadoop - 带有 mapreduce 的 hcatalog

执行 MapReduce 程序时出现以下错误。我已将所有 jars 放在 hadoop/lib 目录中,并且还提到了 -libjars 中的 jars。

这是我正在执行的 cmd:

0 投票
2 回答
959 浏览

apache - 如何构建 apache HCatalog 0.5.0?

已经快 3 个小时了,我无法构建它。请任何人提供步骤。所有文件都建议使用 hcatalog-src-0.5.0-incuvating.tar.gz 但这在互联网上的任何地方都不可用(据我搜索)。然后我下载了分支 0.5.0 但根据文档 http://docs.hortonworks.com/HDPDocuments/HDP1/HDP-1.2.0/ds_HCatalog/install.pdf

对于 0.5.0 版,您必须使用命令构建 l=

现在的问题是 build.xml 没有名为“tar”的目标。所以我只是浏览了 build.xml 并尝试了使用目标作为“包”的相同命令

但随后它向我显示错误。

请帮帮我。

0 投票
3 回答
1631 浏览

hive - 使用 Pig 中的 HcatLoader 访问在 Hive 中创建的视图

我只是在猪的蜂巢和 HcatLoader 中尝试一些东西。我所做的是,在 Hive 中创建了一个视图,然后尝试通过我使用 HcatLoader 创建的视图将数据加载到猪中。但它似乎不起作用。我只是想确认有没有办法做到这一点?当我尝试使用 HcatLoader 在猪中加载视图时出现以下错误

events=使用 org.apache.hcatalog.pig.HCatLoader() 加载“ViewName”;转储事件;

当我使用任何 tableName 而不是 Hive 中的 View 时,它似乎可以工作。此外,它不会给出 Metastore 错误。正如它所说的在转储时成功连接到 metastore at load 语句,它崩溃并出现以下错误。

任何指针都会有所帮助。

谢谢, 阿图尔

0 投票
1 回答
1079 浏览

hadoop - 使用 Hcatalog REST 从 Hive 访问表

我用 CDH4 安装了 Hcatalog(在 Ubuntu 12.04 64 位上),我目前正在尝试使用 REST 访问表信息

我重新启动了 webhcat-server service webhcat-server restart。然后我在终端执行了这个,

我得到了,

{"databases":["default","testas"]}

正如预期的那样(并且正确)。

我尝试了几次并得到了相同的输出。

然后我在浏览器中尝试了同样的方法,我得到了,

然后我回到终端并尝试,

现在不起作用,并输出

为什么会这样?

笔记:

在 中/etc/hcatalog/proto-hive-site.xml,我javax.jdo.option.ConnectionPassword从预先存在PASSWORD的密码更改为hive.

我知道有log4j错误,但我怀疑这与此有关

0 投票
2 回答
387 浏览

hadoop - 使用 Hive 配置的 HCatalog

我想知道是否有人知道在 Hive 上安装 HCatalog 的好教程,这样我就可以通过 Hive 加载数据,通过 Impala 查询并使用 Pig 运行一些脚本?

我想知道从 Cloudera 下载 VM 是否是最佳选择,但我没有看到很多教程(配置步骤很清楚)让 HCatalog 与 Hive 一起运行!

提前致谢 :)

0 投票
2 回答
1041 浏览

hadoop - 如何访问 Hive 日志信息

我正在尝试分析 Hive 查询的性能。虽然我能够使用 Java 进行 Hive 查询,但我仍然需要访问每次查询后生成的日志信息。而不是使用破解来读取磁盘上的最新日志并使用正则表达式来提取数字,我正在寻找一种优雅的方法(如果已经可用)。

任何指针都会有所帮助。提前致谢。

-lg

0 投票
2 回答
1861 浏览

hive - 在 hive 或 hcatalog 中更改数据库的表

有没有办法在 hive 或 Hcatalog 中更改数据库的表?

例如,我foo在数据库中有一个表default,我想把这个表放到数据库中bar。我试试这个,但它不起作用:

提前致谢

0 投票
1 回答
242 浏览

hadoop - 文件大于 Hcatalog 的字段限制

我正在独立工作(我们的集群尚未配置)。我尝试使用 HCatalog 从文件创建新表,但出现以下错误。

field larger than field limit (131072)

这个值似乎是 的值,io.file.buffer.size配置为 131072。我说的对吗?但是,这个选项的描述是 Size of read/write buffer used in SequenceFiles,所以我完全不确定。我的文件是一个文本文件。所以我不确定,这是改变的好属性。

任何想法?

0 投票
2 回答
1504 浏览

hadoop - 如何在 Pig 中使用 HCatlog 对 Hive Metastore 使用压缩技术?

我有一些猪脚本,它使用 PigStorage() 从普通文本文件中获取输入。我想从 Hive Metastore 加载和存储数据,因为我使用了 Hcatalog 中的 HcatLoader() 和 HcatStorage()。有人可以告诉我如何在 pig 中存储和加载压缩配置单元数据。

0 投票
0 回答
350 浏览

hadoop - 使用 MR+hcatalog v/s Hive 运行的不同数量的映射器

我很难弄清楚,为什么当我使用 hive 查询运行查询以及使用 hcatalog 在同一个 hive 表上运行 MR 时,我得到不同数量的映射器。

我正在使用 RC 文件作为我正在访问的表上的存储格式。而且我没有在两个地方(hive 或 MR)对输入拆分大小进行任何调整

任何点击,为什么会发生这种情况,我在运行 MR 时尝试设置 mapred.max.split.size=536870912,它也让我减少了映射器的数量。