问题标签 [azure-hdinsight]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
760 浏览

azure - 在 HDInsight 上使用 HQL 文件时出现 ParseExceptions

我正在关注本教程http://azure.microsoft.com/en-us/documentation/articles/hdinsight-use-hive/但在更改查询源以使用文件时卡住了。

使用时一切正常,但是New-AzureHDInsightHiveJobDefinition -Query $queryString当我尝试存储在 blob 容器的“根”中时,我得到 ExitCode 40000 和标准错误中的以下内容:New-AzureHDInsightHiveJobDefinition -File "/example.hql"example.hql

即使我故意拼错 hql 文件名,仍然会生成上述错误以及未找到预期文件的错误,因此导致错误的不是 hql 的内容。

我无法在 blob 存储中找到 hive-log4j.properties 以查看它是否已损坏,我已拆除 HDInsight 群集并删除了关联的 blob 存储并重新启动,但结果相同。

真的很感激一些帮助!

0 投票
1 回答
1964 浏览

oozie - “数据库已达到其大小配额”

我正在尝试运行以前可以完美运行的 Oozie 作业。但现在我收到以下错误:

原因:org.apache.openjpa.persistence.PersistenceException:数据库“v0201xxxxxxxxxxxxxxxxxxxxooziemetastore”已达到其大小配额。分区或删除数据、删除索引或查阅文档以获取可能的解决方案。{prepstmnt 1642246000 UPDATE WF_ACTIONS SET error_code = ?, error_message = ?, external_status = ?, last_check_time = ?, pending_age = ?, status = ? 在哪里 id = ?[params=?, ?, ?, ?, ?, ?, ?]} [code=40544, state=S0001]
FailedObject: org.apache.oozie.WorkflowActionBean-0014872-140428144646972-oozie-hdp-W@RunHiveScript at org .apache.openjpa.jdbc.sql.DBDictionary.narrow(DBDictionary.java:4869)
at org.apache.openjpa.jdbc.sql.DBDictionary.newStoreException(DBDictionary.java:4829)
在 org.apache.openjpa.jdbc.sql.SQLExceptions.getStore(SQLExceptions.java:136)

0 投票
1 回答
782 浏览

hadoop - HDInsight Hive 在 ADD JAR 语句中找不到 SerDe jar

我已使用路径“/lib/”将 json-serde-1.1.9.2.jar 上传到 blob 存储并添加

但我越来越

我已经在没有路径的情况下尝试过它,并且还提供了ADD JAR具有相同结果的语句的完整 url。

非常感谢您对此的帮助,谢谢!

0 投票
1 回答
1430 浏览

azure - 根据年、月和日期格式在 hive 中进行外部分区

我正在使用微软天蓝色 HDInsight。我有以下格式的数据。

容器/文件夹/年/月/日/file1.csv

容器/文件夹/年/月/日期/file2.csv 。. 。等等。

我使用以下查询创建了一个带有分区的外部表

得到查询提交成功并创建外部表的输出。

然后给了Alter命令添加分区。

即使在这里也没有得到任何错误。

然后,当我给出一个简单的选择语句时,我无法从数据文件中检索任何内容。

也试过

两个 select 语句都没有返回任何东西。无法弄清楚出了什么问题。请问有什么建议吗?

0 投票
1 回答
780 浏览

c# - 在 C# 中连接 hadoop

我想使用 HDInsight 在 c# 中连接 hadoop。我在 AZURE 中创建了一个集群,并且创建成功。我还启用了远程桌面连接。当我在 C# 中输入凭据并执行作业时,我收到连接错误。我对提供参数感到困惑。请帮助我。

最后一行给出了例外。异常消息是:

出现一个或多个错误

这是内部的例外:

无法连接到远程服务器

0 投票
1 回答
362 浏览

c# - 通过代码为 hadoop 作业提供输入

我是hadoop的初学者。我想了解 map reduce 函数的流程。我有点困惑,如何通过代码而不是任何文件为地图作业提供输入。我应该如何配置它。请帮助我。这是我的代码。

我通过流媒体单元得到了正确的结果。现在,我想在天蓝色中执行这项工作。那么我如何通过代码而不是文件提供输入呢?我已经通过配置给出了输入,即

但是当我执行作业时会发生此异常:

0 投票
2 回答
1690 浏览

sql - 如何在具有多个文件的多个目录上运行配置单元查询

我想对其中包含多个文件的多个目录运行计数配置单元查询。文件路径如下所示

等等。

我创建了一个具有以下分区的外部表

并尝试将分区添加到该月。

试过这个查询

但计数显示为零。关于如何做到这一点的任何建议?

0 投票
1 回答
151 浏览

azure - 访问 HDInsight 上的猪日志

如何访问 HDInsight 上的猪日志文件?

当 pig 出错时,输出显示:

我在 blob 商店中找不到类似的东西,我不知道如何访问该路径。

干杯。

0 投票
3 回答
386 浏览

powershell - 通过 PowerShell 启用对 HDInsight 群集的 RDP 访问

我通过 PowerShell 创建了一个 HDInsight 群集,并通过登录 Azure 管理门户启用了对它的 RDP 访问。但是,我想知道是否可以通过 PowerShell 启用对 HDInsight 群集的 RDP 访问。如果是,请指点。

0 投票
2 回答
2286 浏览

hadoop - 如何设置 Pig STORE 命令的输出目录?

我通过 Azure HDInsight 使用 Pig。我可以提交以 STORE 结尾的查询,如下所示:

这有效,将输出存储在目录中/user/hdp/results/。但是我想控制输出目录。两个我都试过了...

这些都不起作用。他们都产生这个错误:

我的问题是,我可以控制 Store 命令的输出目录吗?还是必须进入用户目录?