问题标签 [azure-hdinsight]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
azure - 在 HDInsight 上使用 HQL 文件时出现 ParseExceptions
我正在关注本教程http://azure.microsoft.com/en-us/documentation/articles/hdinsight-use-hive/但在更改查询源以使用文件时卡住了。
使用时一切正常,但是New-AzureHDInsightHiveJobDefinition -Query $queryString
当我尝试存储在 blob 容器的“根”中时,我得到 ExitCode 40000 和标准错误中的以下内容:New-AzureHDInsightHiveJobDefinition -File "/example.hql"
example.hql
即使我故意拼错 hql 文件名,仍然会生成上述错误以及未找到预期文件的错误,因此导致错误的不是 hql 的内容。
我无法在 blob 存储中找到 hive-log4j.properties 以查看它是否已损坏,我已拆除 HDInsight 群集并删除了关联的 blob 存储并重新启动,但结果相同。
真的很感激一些帮助!
oozie - “数据库已达到其大小配额”
我正在尝试运行以前可以完美运行的 Oozie 作业。但现在我收到以下错误:
原因:org.apache.openjpa.persistence.PersistenceException:数据库“v0201xxxxxxxxxxxxxxxxxxxxooziemetastore”已达到其大小配额。分区或删除数据、删除索引或查阅文档以获取可能的解决方案。{prepstmnt 1642246000 UPDATE WF_ACTIONS SET error_code = ?, error_message = ?, external_status = ?, last_check_time = ?, pending_age = ?, status = ? 在哪里 id = ?[params=?, ?, ?, ?, ?, ?, ?]} [code=40544, state=S0001]
FailedObject: org.apache.oozie.WorkflowActionBean-0014872-140428144646972-oozie-hdp-W@RunHiveScript at org .apache.openjpa.jdbc.sql.DBDictionary.narrow(DBDictionary.java:4869)
at org.apache.openjpa.jdbc.sql.DBDictionary.newStoreException(DBDictionary.java:4829)
在 org.apache.openjpa.jdbc.sql.SQLExceptions.getStore(SQLExceptions.java:136)
hadoop - HDInsight Hive 在 ADD JAR 语句中找不到 SerDe jar
我已使用路径“/lib/”将 json-serde-1.1.9.2.jar 上传到 blob 存储并添加
但我越来越
我已经在没有路径的情况下尝试过它,并且还提供了ADD JAR
具有相同结果的语句的完整 url。
非常感谢您对此的帮助,谢谢!
azure - 根据年、月和日期格式在 hive 中进行外部分区
我正在使用微软天蓝色 HDInsight。我有以下格式的数据。
容器/文件夹/年/月/日/file1.csv
容器/文件夹/年/月/日期/file2.csv 。. 。等等。
我使用以下查询创建了一个带有分区的外部表
得到查询提交成功并创建外部表的输出。
然后给了Alter命令添加分区。
即使在这里也没有得到任何错误。
然后,当我给出一个简单的选择语句时,我无法从数据文件中检索任何内容。
也试过
两个 select 语句都没有返回任何东西。无法弄清楚出了什么问题。请问有什么建议吗?
c# - 在 C# 中连接 hadoop
我想使用 HDInsight 在 c# 中连接 hadoop。我在 AZURE 中创建了一个集群,并且创建成功。我还启用了远程桌面连接。当我在 C# 中输入凭据并执行作业时,我收到连接错误。我对提供参数感到困惑。请帮助我。
最后一行给出了例外。异常消息是:
出现一个或多个错误
这是内部的例外:
无法连接到远程服务器
c# - 通过代码为 hadoop 作业提供输入
我是hadoop的初学者。我想了解 map reduce 函数的流程。我有点困惑,如何通过代码而不是任何文件为地图作业提供输入。我应该如何配置它。请帮助我。这是我的代码。
我通过流媒体单元得到了正确的结果。现在,我想在天蓝色中执行这项工作。那么我如何通过代码而不是文件提供输入呢?我已经通过配置给出了输入,即
但是当我执行作业时会发生此异常:
sql - 如何在具有多个文件的多个目录上运行配置单元查询
我想对其中包含多个文件的多个目录运行计数配置单元查询。文件路径如下所示
等等。
我创建了一个具有以下分区的外部表
并尝试将分区添加到该月。
试过这个查询
但计数显示为零。关于如何做到这一点的任何建议?
azure - 访问 HDInsight 上的猪日志
如何访问 HDInsight 上的猪日志文件?
当 pig 出错时,输出显示:
我在 blob 商店中找不到类似的东西,我不知道如何访问该路径。
干杯。
powershell - 通过 PowerShell 启用对 HDInsight 群集的 RDP 访问
我通过 PowerShell 创建了一个 HDInsight 群集,并通过登录 Azure 管理门户启用了对它的 RDP 访问。但是,我想知道是否可以通过 PowerShell 启用对 HDInsight 群集的 RDP 访问。如果是,请指点。
hadoop - 如何设置 Pig STORE 命令的输出目录?
我通过 Azure HDInsight 使用 Pig。我可以提交以 STORE 结尾的查询,如下所示:
这有效,将输出存储在目录中/user/hdp/results/
。但是我想控制输出目录。两个我都试过了...
和
这些都不起作用。他们都产生这个错误:
我的问题是,我可以控制 Store 命令的输出目录吗?还是必须进入用户目录?