问题标签 [cloudera-cdh]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - 在包裹管理的 Cloudera 环境中,用于批量 hbase 索引的 map reduce JAR 在哪里?
我正在尝试在我的包裹管理的 Cloudera-CDH 4.7 环境中运行一些批处理索引。Search 1.2和Search 1.3的说明引用了/usr/lib/solr/contrib/mr/search-mr-*-job.jar
我似乎没有的文件。它位于包裹管理环境中的什么位置?
join - 连接表时 Hive 查询出错
我无法使用以下 HIVE 查询通过相等性检查。
我有 3 张桌子,我想加入这些桌子。我尝试如下,但得到错误:
失败:语义分析错误:第 3:40 行在 JOIN 'visit_date' 中遇到左右别名
根据 FuzzyTree 的帮助编辑:
第一个:
我们尝试使用 between 和 where 子句编辑上述查询,但没有从查询中获得任何输出。
但是如果我们通过删除带日期的 between 子句来更改上述查询,那么我会得到一些基于“v3.adv_price <= t3.comp_price”的输出,但没有使用“日期过滤器”。
第二:
接下来我们尝试只传递一个日期:
所以,现在它显示了一些结果,但是如果我们同时通过了开始和结束日期过滤器,它;没有显示任何结果。
oozie - 如何使用 Bamboo 触发 oozie 工作流作业?
我是竹子新手。我一般都知道如何在 CDH 环境中触发 oozie 工作流作业。有人可以建议一些描述这一点的好文档吗?
在 Bamboo 中,我刚刚创建了一个计划,每次我签入时都会生成指向我的存储库的代码。现在我需要知道 - 如何从竹子中触发工作流作业?
我知道这应该是某种需要从竹子触发才能执行的命令。请,建议
hadoop - 如何在 CDH5.1 vm 上配置 MR1
我已经在我的机器上安装了 CDH5.1 VM。CDH 5.1 默认设置为 MR2(YARN)。我想将配置从 MR2 更改为 MR1。要求让我知道需要进行的更改。
hadoop - 如何按顺序运行 Hue Hive 查询
我已经建立Cloudera Hue
并拥有一个 200 Gib 和 16 Gib RAM 的主节点集群以及每个 150 Gib 和 8 Gib Ram 的 3 个 datnodes。
我有大约 70 Gib 的数据库。问题是当我尝试从 hive editor( HUE GUI
) 运行 Hive 查询时。如果我提交 5 到 6 个查询(用于执行),作业已启动,但它们挂起并且从不运行。如何按顺序运行查询。我的意思是即使我可以提交查询,但新查询应该只在上一个查询完成时才开始。有什么办法可以让查询一一运行吗?
hadoop - Hadoop namenode 未启动 CDH4.7
在 Mint-17(Linux) 操作系统中从 CDH4.7 新安装 hadoop 后,namenode 未启动,但辅助 namenode、tasktracker、jobtracker 和 datanode 已启动。
这里是相关信息
/etc/hadoop/conf/hdfs-site.xml
/etc/hadoop/conf/core-site.xml
/etc/hadoop/conf/mapred-site.xml
ls -l /etc/hadoop/conf
sudo hadoop 名称节点-格式
sudo 服务 hadoop-hdfs-namenode 启动
须藤 jps
猫 /var/log/hadoop-hdfs/hadoop-hdfs-namenode-surendhar.out
sudo ls -lR /var/lib/hadoop-hdfs/cache
cloudera - Impala LDAPS 总是因未知 CA 而失败
我正在尝试使用 ldaps 在 Cloudera Manager 的 Impala 命令行参数高级配置片段配置项中使用以下配置验证与 Impala 数据库的连接:
--enable_ldap=true
--ldap_uri=ldaps://testServ.domain.com
--ldap_ca_certificate="/home/impala/testServ.domain.pem"
其中 testServ.domain.pem 是 ldap 服务器证书。
使用wireshark,我可以看到在SSL 协商期间收到证书后,Impala 总是响应未知CA 警报。
我可以使用未加密的 ldap 成功连接到 Impala,并且可以使用提供的证书连接到启用了不同 ldaps 的程序,所以我怀疑问题出在 ldap 服务器上。
是否有我需要的另一个配置参数或一种方法来确定为什么 Impala 总是拒绝 ldap 服务器证书?
hadoop - Oozie 中的 Hive 操作间歇性失败 - CDH 5.1 - Oozie 4.0.0
我们有一个 oozie 工作流,其中包含简单的“create”和“alter”语句,“create”语句在 Hive Action 中使用“RCFILE”文件格式。
我们面临的挑战是这个 Hive 操作有时会成功执行,有时会失败......我们无法解决这个问题。
它抛出关于“serde”的“NoSuchMethodError”异常。
有人可以帮我解决这个问题吗?
hadoop - 日志容器重定向失败
最近我们用 CDH 5 升级到 YARN。
(版本:2.3.0 cdh5.1.3,r8e266e052e423af592871e2dfe09d54c03f6a0e8)
我试图通过单击 ApplicationMaster 上的日志从资源管理器访问失败作业的日志,但出现以下错误:
container_1412602970010_0037_01_000002 的重定向失败尝试构建到日志服务器的重定向 url 失败。Log Server url 可能未配置 Container 不存在。
同样在pig/mapreduce
工作中,我们看到以下警告:
信息:2014-10-07 15:42:19,134 [main] WARN org.apache.hadoop.security.UserGroupInformation - PriviledgedActionException as:jobs (auth:SIMPLE) 原因:java.io.IOException: org.apache.hadoop.ipc .RemoteException(org.apache.hadoop.yarn.exceptions.YarnRuntimeException): 无法加载历史文件 hdfs://prod-hadoop:8020/user/history/done_intermediate/jobs/job_1412706451566_0032-1412710613932-jobs-PigLatin%3Aclk_imp_join_2014%2D10 %2D04T13-1412710831122-14-2-SUCCEEDED-root.jobs-1412710694546.jhist
我在配置中遗漏了什么吗?
hadoop - YARN JobHistory 错误:容器重定向失败
我们最近使用 CDH 5 (2.3.0-cdh5.1.3) 部署了 YARN,集群正在运行文件,作业也在运行。但是,如果作业完成(成功/失败),我们无法从资源管理器 UI 访问日志,我们会收到以下错误
运行作业也有一些例外:
hdfs://user/history/ 的适当权限是什么?
有人有同样的问题吗?