“hcatalog”的相关标签问题_Stack Overflow中文网

0 投票

2 回答

1824 浏览

hadoop - HCatalog 在使用前需要安装吗？

谁能告诉我，HCatalog 在使用前需要安装吗？或者它可以作为一个jar文件使用？

我在 VM 上运行 Cloudera，我可以将 HCatalog 用于我的 MR 工作 Pig、Hive 没有问题。而且我认为相同的 MR 代码可以与另一个安装了 hadoop 的平台一起使用，但显然情况并非如此，HCatInputFormat.setInput() 上抛出了异常。当我使用时Pig -useHCatalog，我被提示使用错误，这意味着它不知道-useHCatalog作为参数是什么。

之前没有考虑过这一点，因为一直在 Cloudera 上使用 HCatalog ......

hadoop hcatalog

2013-11-04T21:46:40.623

0 投票

2 回答

6880 浏览

hive - HBase 和 HCatalog 之间有什么相关性？

谁能解释一下，HCatalog 和 HBase 之间的关联是什么？

我找到了这些定义：

Apache HCatalog HCatalog 是一个元数据抽象层，用于在不使用底层文件名或格式的情况下引用数据。它将用户和脚本与数据的物理存储方式和位置隔离开来。

Apache HBase HBase（Hadoop 数据库）是一个分布式的、面向列的数据库。HBase 使用 HDFS 作为底层存储。它支持使用 MapReduce 的批处理式计算和点查询（随机读取）。

当我们在 Hive 中使用 CREATE TABLE 时，它会在 HCatalog 中创建表。我只是不明白。为什么不在 HBase 的真实 DATABASE 中？

HCatalog 似乎是所有数据存储的某种元数据存储库。这是否意味着它还在 HBase 中保留有关数据库和表的信息？

我会很感激解释

问候帕维尔

2013-11-15T09:31:49.550

0 投票

3 回答

3133 浏览

load - 类型转换的问题 - Pig -> HCatalog

我正在尝试从 HCatalog 加载表，对数据进行一些练习并将其存储到另一个表中。

源表：stage.iboa_event_definitions

目的地表：

我的脚本：

我得到错误：

2013-11-26 13:18:06,140 [main] INFO org.apache.pig.tools.pigstats.ScriptState - 脚本中使用的 Pig 功能：RANK 2013-11-26 13:18:06,143 [main] INFO org. apache.pig.newplan.logical.rules.ColumnPruneVisitor - 为 iboa_event_definitions 修剪的列：$3、$4、$5 2013-11-26 13:18:06,212 [main] 错误 org.apache.pig.tools.grunt.Grunt - 错误 1115 ： 不支持的类型：Pig 的架构中的 10日志文件中的详细信息：/export/home/pig/pig_1385463241554.log

为什么？让我们检查字段类型。

也许错误是由 Long 类型引起的？但这就是为什么我尝试将其转换为 int 的原因。

谁能帮我解决这个问题？

谢谢

帕维尔

load apache-pig hcatalog

2013-11-26T12:30:21.793

0 投票

1 回答

577 浏览

c# - 无法对 HDInsight 中非默认容器中的 Hive 表远程运行查询

我正在尝试使用Linq to Hive从 .NET 启动 Hive 查询。

挑战在于查询应该在不在默认 HDInsight 容器中的外部表上运行，因此我已将容器的凭据添加到core-site.xml并重新启动 Hive 的守护进程。

但是，我收到以下错误：

容器...帐户中...未找到，我们无法使用匿名凭据创建它。

这是我的代码：

连接成功并创建了 Hive 作业（我什至可以看到带有查询的 HQL 文件），但 Hive 作业将上述错误写入 stderr。

我已经尝试解决这个问题几个小时，改变这个和那个，我什WebHCatHttpClient至尝试过代替 Linq，但无济于事......有什么想法吗？

c#hadoop hive azure-hdinsight hcatalog

2013-12-01T14:46:53.070

0 投票

2 回答

1722 浏览

java - 猪和 HCatalog

运行“pig -useHCatalog”时出现以下错误。

我已经定义了所有的环境变量（包括 PIG_CLASSPATH），并且还在 pig.properties 文件中定义了 pig.additiona.jars

在 pig.properties 文件中，

请让我知道如何解决这个问题。谢谢！

java hadoop jar apache-pig hcatalog

2013-12-11T13:41:43.223

0 投票

1 回答

148 浏览

hadoop - 在单个减速器中写入多个 HCatalog 模式？

我有一组在我们开始使用 Hive 之前编写的 Hadoop 流。添加 Hive 时，我们将数据文件配置为外部表。现在我们正在考虑重写流程以使用 HCatalog 输出其结果。我们进行更改的主要动机是利用动态分区。

我遇到的障碍之一是我们的一些 reducer 会生成多个数据集。今天这是用副作用文件完成的，所以我们在一个 reduce 步骤中将每个记录类型写到它自己的文件中，我想知道我有什么选择可以用 HCatalog 来做这件事。

一种选择显然是让每个作业只生成一个记录类型，为每种类型重新处理一次数据。我想避免这种情况。

某些工作的另一个选择是更改我们的模式，以便所有记录都存储在一个模式中。显然，如果数据只是为了穷人的分区而被分解，这个选项很有效，因为 HCatalog 将负责根据字段对数据进行分区。但是，对于其他工作，记录的类型并不一致。

似乎我可以使用 Reader/Writer 接口来传递一组写入器上下文，每个模式一个，但我还没有真正考虑过（而且我只看了一天的 HCatalog，所以我可能会误解 Reader/Writer 接口）。

有没有人有在单个 reduce 步骤中写入多个模式的经验？任何指针将不胜感激。

谢谢。

安德鲁

hadoop hive hcatalog

2013-12-13T22:40:27.290

0 投票

1 回答

1440 浏览

hive - Hadoop + Hive - hcatalog 不会启动

我刚刚安装了一个在 ubuntu 上运行的单节点 Hadoop 2.2.0 集群。我尝试了几个基本的示例计算，效果很好。

然后我尝试设置 hive 0.12.0，其中包括 hcatalog。

我实际上遵循本教程。

当我尝试启动 hcatalog 时，我总是收到以下错误：

bash $HIVE_HOME/hcatalog/sbin/hcat_server.sh 开始

目录名：缺少操作数尝试使用 `dirname --help' 获取更多信息。启动 Metastore 服务器初始化，测试初始化是否正确...

/usr/local/hive/hcatalog/sbin/hcat_server.sh：第 91 行：/usr/local/hive-0.12.0/hcatalog/sbin/../var/log/hcat.out：没有这样的文件或目录

Metastore 启动失败，见 /usr/local/hive-0.12.0/hcatalog/sbin/../var/log/hcat.err

但是根本没有 hcat.err 文件，我现在有点被阻止了。

任何帮助将非常感激！

提前致谢，

纪尧姆

hive hcatalog

2014-01-20T19:06:08.343

0 投票

0 回答

1307 浏览

apache-pig - 转储工作，但存储没有 - 猪 - 我在哪里可以找到错误的详细信息？

我正在尝试加载 apache 日志，拆分为字段并将其保存到 hcatalog。

如果我做：

有用。

但

没有。

错误：

我在哪里可以找到问题的任何细节？有一个信息，我可以在下面找到更多详细信息：
hadoop1:50030/jobdetails.jsp?jobid=job_201402120751_0117
但是当工作完成时它不起作用......

问候
帕维尔

apache-pig hcatalog

2014-02-17T07:24:34.560

0 投票

2 回答

3986 浏览

java - PIG - 找到接口 org.apache.hadoop.mapreduce.JobContext，但预期类

我试图从蜂巢加载一张桌子。我为此使用 Hcatalog。

我使用

我从 hive 和 hadoop 中导出几乎所有的罐子

我也试过这个命令

是版本不匹配的问题吗？

我正在使用 Hadoop 2.0.0-cdh4.5.0 和 pig-0.12.0-src

请帮忙

java hadoop hive apache-pig hcatalog

2014-02-19T06:45:39.323

0 投票

3 回答

2070 浏览

hive - 类型转换猪 hcatalog

我使用 HCatalog 0.4 版。我在配置单元“abc”中有一个表，其中有一列数据类型为“timestamp”。当我尝试运行这样的猪脚本时，“raw_data = load 'abc' using org.apache.hcatalog.pig.HCatLoader();” 我收到一条错误消息“java.lang.TypeNotPresentException：类型时间戳不存在”。

hive apache-pig hcatalog

2014-02-20T00:41:46.433

问题标签 [hcatalog]

Reference