问题标签 [hortonworks-sandbox]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
134 浏览

hadoop - HDP 2.5 - 错误是 Kerberizing 沙箱

我正在尝试对 HDP 2.5 进行 kerberize,并在使用此操作时出错...

用于 kerberize 的链接:https ://docs.hortonworks.com/HDPDocuments/Ambari-2.2.1.1/bk_Ambari_Security_Guide/content/_installing_and_configuring_the_kdc.html

我已经安装了新的 KDC,并启动了它。此外,已设置 jcs。

在 Ambari UI 上,我单击启动 Kerberos UI,并填写 KDC 的详细信息。

单击下一步时,我收到错误 - 安装 Kerberos 客户端



对此有什么想法吗?

注意:我在 HDP 2.4 中没有遇到这个问题,它已成功进行了kerberized。另外,我正在使用 HDP 2.5 沙盒(使用 VirtualBox)。

0 投票
1 回答
140 浏览

hadoop - 如何弄清楚 Hadoop 类路径 fin HDP2.5 沙箱中的 JAR 是什么?

如何找出 Hadoop 类路径中的 JAR 是什么?我正在使用 Hortonworks 2.5 沙箱,并希望使用已经存在的即时沙箱 Hadoop JAR 运行我的自定义应用程序

0 投票
1 回答
1036 浏览

python - 无法将请求导入 Python:ImportError no module named urllib3

我已经对此进行了搜索,但我遇到的其他示例是人们在安装请求时遇到问题,我的问题是关于导入模块:

使用 Putty(连接到 HDF 2.4 沙盒会话)和 Python 调用 API。

昨晚,我有这个工作 - 安装请求模块没问题,定义 Python,然后发出 GET 请求,工作完美。

今晚,我遵循了完全相同的步骤,但是当我尝试“导入请求”时,我收到了错误:

我昨晚复制的步骤是:

图我一定是不经意间改变了一些东西......有人可以请教吗?

0 投票
2 回答
1547 浏览

hadoop - 使用 Nifi 将数据摄取到 HDFS - 无法访问文件

所以,我是第一次使用 NiFi。我正在尝试使用它来调用 API,然后将数据通过管道传输到 HDFS(Hortonworks Sandbox 2.4)。我目前只使用 2 个处理器:GetHTTP 和 PutHDFS。

我似乎将两个处理器都配置好了...它们运行了,但是我找不到通过 Ambari 进入 Hadoop 时创建的输出文件...我已将输出目录设置为 /user/,但什么也没有出现。但是,我在 PutHDFS 处理器上收到一条警告消息,建议:

...所以必须在某处写入文件。我尝试改变指定 xml 和 JSON 格式的 API 调用,但没有明显区别。

我想我必须要么需要在 NiFi 中的管道中添加一些处理,要么我在沙箱中寻找错误的位置。有人可以建议吗?

0 投票
1 回答
903 浏览

hadoop - 如何将文件从 ubuntu 桌面传输到 hortonworks 沙箱

我的 ubuntu 的本地桌面上有一个 jar 文件。想转移到在 vm player 中运行的 Hortonworks 沙箱。在 windows 中我们有 wincp 来执行它。我不知道如何在 ubuntu 中执行它。能否请你帮忙。

0 投票
0 回答
56 浏览

json - 使用 Pig 操作 json 文件

我已经将一个 json 文件调用到 HDFS(在虚拟机上运行的 HDF 2.4 沙箱),现在我想使用 Pig 来操作文件中的数据。

我开始尝试定义模式以使用 JsonLoader 将文件传递给 Pig,但是当我在某个地方读到 Pig 无法处理多行文件时放弃了这一点,我怀疑这可能是(这是我第一次使用json 并且数据文件的结构非常复杂 - 它是 5 天的 3 小时天气预报数据,来自 Met Office api ( http://www.metoffice.gov.uk/datapoint/product/uk-3hourly-site -特定预测)。

我的问题是:将这些数据简单地导入 Pig 以便我可以开始操作它的最快、最简单的方法是什么?

我碰巧我的手臂运行了以下脚本来加载文件,但由于文件只有 4.3Kb,并且脚本现在已经运行了超过 15 分钟,没有结果或生成日志,我得出的结论是这种方法没有成功了:

非常感谢任何指导谢谢。

0 投票
1 回答
154 浏览

json - 使用 Nifi 构建摄取的 json 数据的可能性

是否可以使用 Nifi 将 json 文件加载到结构化表中?

我调用了以下天气预报数据(来自 6000 个气象站),我目前正在将其加载到 HDFS 中。这一切都出现在一行中:

理想情况下,我希望将架构构造成一个 6000 行的表。

我尝试编写一个模式将上述内容传递给 Pig,但没有成功,可能是因为我对 json 不够熟悉,无法正确翻译。

寻找一种向数据添加一些结构的简单方法,我发现 Nifi 中有一个 PutHBaseJson 处理器。

谁能建议这个 PutHBaseJson 处理器是否适用于上述数据结构?如果是这样,任何人都可以向我指出一个体面的教程,给我一个配置的起点吗?

非常感谢任何指导。

0 投票
1 回答
658 浏览

hortonworks-data-platform - 如何让 Ambari 服务自动启动

我正在实现 Ambari 服务,需要在集群启动后自动启动它。metainfo.xml 中是否有一些选项可以启用此功能?

0 投票
1 回答
1909 浏览

mapreduce - 文本到字符串映射减少

我正在尝试在 Hortonworks Sandbox 中使用 mapreduce2(yarn) 拆分字符串。如果我尝试访问 val[1] ,它会引发 ArrayOutOfBound 异常,当我不拆分输入文件时可以正常工作。

映射器:

减速器:

主类:

你能帮我吗?

更新:

发现它不会将文本转换为字符串。

0 投票
0 回答
108 浏览

json - Hive 不通过 Flume 查询存储在 hdfs 中的数据

我正在做一个大数据项目,并在 Hive 中创建了一个外部表,该表应该查询存储在 HDFS 中的数据。使用 Flume 将数据流式传输到 HDFS。但是,当我查询存储在 HDFS 中的数据时出现错误。所有权限似乎都可以。HDFS中存储数据的权限是-rw-r--r--

创建的表如下:

我花了几个小时寻找这个案例,但没有运气。正在生成的错误日志如下:

我只粘贴了错误日志的开头,因为它会生成一个巨大的日志。我很乐意感谢任何有关错误的帮助和指导。提前致谢。