问题标签 [hortonworks-sandbox]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - HDP 2.5 - 错误是 Kerberizing 沙箱
我正在尝试对 HDP 2.5 进行 kerberize,并在使用此操作时出错...
用于 kerberize 的链接:https ://docs.hortonworks.com/HDPDocuments/Ambari-2.2.1.1/bk_Ambari_Security_Guide/content/_installing_and_configuring_the_kdc.html
我已经安装了新的 KDC,并启动了它。此外,已设置 jcs。
在 Ambari UI 上,我单击启动 Kerberos UI,并填写 KDC 的详细信息。
单击下一步时,我收到错误 - 安装 Kerberos 客户端
对此有什么想法吗?
注意:我在 HDP 2.4 中没有遇到这个问题,它已成功进行了kerberized。另外,我正在使用 HDP 2.5 沙盒(使用 VirtualBox)。
hadoop - 如何弄清楚 Hadoop 类路径 fin HDP2.5 沙箱中的 JAR 是什么?
如何找出 Hadoop 类路径中的 JAR 是什么?我正在使用 Hortonworks 2.5 沙箱,并希望使用已经存在的即时沙箱 Hadoop JAR 运行我的自定义应用程序
python - 无法将请求导入 Python:ImportError no module named urllib3
我已经对此进行了搜索,但我遇到的其他示例是人们在安装请求时遇到问题,我的问题是关于导入模块:
使用 Putty(连接到 HDF 2.4 沙盒会话)和 Python 调用 API。
昨晚,我有这个工作 - 安装请求模块没问题,定义 Python,然后发出 GET 请求,工作完美。
今晚,我遵循了完全相同的步骤,但是当我尝试“导入请求”时,我收到了错误:
我昨晚复制的步骤是:
图我一定是不经意间改变了一些东西......有人可以请教吗?
hadoop - 使用 Nifi 将数据摄取到 HDFS - 无法访问文件
所以,我是第一次使用 NiFi。我正在尝试使用它来调用 API,然后将数据通过管道传输到 HDFS(Hortonworks Sandbox 2.4)。我目前只使用 2 个处理器:GetHTTP 和 PutHDFS。
我似乎将两个处理器都配置好了...它们运行了,但是我找不到通过 Ambari 进入 Hadoop 时创建的输出文件...我已将输出目录设置为 /user/,但什么也没有出现。但是,我在 PutHDFS 处理器上收到一条警告消息,建议:
...所以必须在某处写入文件。我尝试改变指定 xml 和 JSON 格式的 API 调用,但没有明显区别。
我想我必须要么需要在 NiFi 中的管道中添加一些处理,要么我在沙箱中寻找错误的位置。有人可以建议吗?
hadoop - 如何将文件从 ubuntu 桌面传输到 hortonworks 沙箱
我的 ubuntu 的本地桌面上有一个 jar 文件。想转移到在 vm player 中运行的 Hortonworks 沙箱。在 windows 中我们有 wincp 来执行它。我不知道如何在 ubuntu 中执行它。能否请你帮忙。
json - 使用 Pig 操作 json 文件
我已经将一个 json 文件调用到 HDFS(在虚拟机上运行的 HDF 2.4 沙箱),现在我想使用 Pig 来操作文件中的数据。
我开始尝试定义模式以使用 JsonLoader 将文件传递给 Pig,但是当我在某个地方读到 Pig 无法处理多行文件时放弃了这一点,我怀疑这可能是(这是我第一次使用json 并且数据文件的结构非常复杂 - 它是 5 天的 3 小时天气预报数据,来自 Met Office api ( http://www.metoffice.gov.uk/datapoint/product/uk-3hourly-site -特定预测)。
我的问题是:将这些数据简单地导入 Pig 以便我可以开始操作它的最快、最简单的方法是什么?
我碰巧我的手臂运行了以下脚本来加载文件,但由于文件只有 4.3Kb,并且脚本现在已经运行了超过 15 分钟,没有结果或生成日志,我得出的结论是这种方法没有成功了:
非常感谢任何指导谢谢。
json - 使用 Nifi 构建摄取的 json 数据的可能性
是否可以使用 Nifi 将 json 文件加载到结构化表中?
我调用了以下天气预报数据(来自 6000 个气象站),我目前正在将其加载到 HDFS 中。这一切都出现在一行中:
理想情况下,我希望将架构构造成一个 6000 行的表。
我尝试编写一个模式将上述内容传递给 Pig,但没有成功,可能是因为我对 json 不够熟悉,无法正确翻译。
寻找一种向数据添加一些结构的简单方法,我发现 Nifi 中有一个 PutHBaseJson 处理器。
谁能建议这个 PutHBaseJson 处理器是否适用于上述数据结构?如果是这样,任何人都可以向我指出一个体面的教程,给我一个配置的起点吗?
非常感谢任何指导。
hortonworks-data-platform - 如何让 Ambari 服务自动启动
我正在实现 Ambari 服务,需要在集群启动后自动启动它。metainfo.xml 中是否有一些选项可以启用此功能?
mapreduce - 文本到字符串映射减少
我正在尝试在 Hortonworks Sandbox 中使用 mapreduce2(yarn) 拆分字符串。如果我尝试访问 val[1] ,它会引发 ArrayOutOfBound 异常,当我不拆分输入文件时可以正常工作。
映射器:
减速器:
主类:
你能帮我吗?
更新:
发现它不会将文本转换为字符串。
json - Hive 不通过 Flume 查询存储在 hdfs 中的数据
我正在做一个大数据项目,并在 Hive 中创建了一个外部表,该表应该查询存储在 HDFS 中的数据。使用 Flume 将数据流式传输到 HDFS。但是,当我查询存储在 HDFS 中的数据时出现错误。所有权限似乎都可以。HDFS中存储数据的权限是-rw-r--r--
创建的表如下:
我花了几个小时寻找这个案例,但没有运气。正在生成的错误日志如下:
我只粘贴了错误日志的开头,因为它会生成一个巨大的日志。我很乐意感谢任何有关错误的帮助和指导。提前致谢。