问题标签 [hortonworks-sandbox]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

190 问题

0 投票

0 回答

134 浏览

hadoop - HDP 2.5 - 错误是 Kerberizing 沙箱

我正在尝试对 HDP 2.5 进行 kerberize，并在使用此操作时出错...

用于 kerberize 的链接：https ://docs.hortonworks.com/HDPDocuments/Ambari-2.2.1.1/bk_Ambari_Security_Guide/content/_installing_and_configuring_the_kdc.html

我已经安装了新的 KDC，并启动了它。此外，已设置 jcs。

在 Ambari UI 上，我单击启动 Kerberos UI，并填写 KDC 的详细信息。

单击下一步时，我收到错误 - 安装 Kerberos 客户端

对此有什么想法吗？

注意：我在 HDP 2.4 中没有遇到这个问题，它已成功进行了kerberized。另外，我正在使用 HDP 2.5 沙盒（使用 VirtualBox）。

2016-12-06T22:00:19.087

0 投票

1 回答

140 浏览

hadoop - 如何弄清楚 Hadoop 类路径 fin HDP2.5 沙箱中的 JAR 是什么？

如何找出 Hadoop 类路径中的 JAR 是什么？我正在使用 Hortonworks 2.5 沙箱，并希望使用已经存在的即时沙箱 Hadoop JAR 运行我的自定义应用程序

hadoop classpath hortonworks-data-platform hortonworks-sandbox

2016-12-22T11:08:01.847

0 投票

1 回答

1036 浏览

python - 无法将请求导入 Python：ImportError no module named urllib3

我已经对此进行了搜索，但我遇到的其他示例是人们在安装请求时遇到问题，我的问题是关于导入模块：

使用 Putty（连接到 HDF 2.4 沙盒会话）和 Python 调用 API。

昨晚，我有这个工作 - 安装请求模块没问题，定义 Python，然后发出 GET 请求，工作完美。

今晚，我遵循了完全相同的步骤，但是当我尝试“导入请求”时，我收到了错误：

我昨晚复制的步骤是：

图我一定是不经意间改变了一些东西......有人可以请教吗？

python urllib3 hortonworks-sandbox

2017-01-07T22:06:49.377

0 投票

2 回答

1547 浏览

hadoop - 使用 Nifi 将数据摄取到 HDFS - 无法访问文件

所以，我是第一次使用 NiFi。我正在尝试使用它来调用 API，然后将数据通过管道传输到 HDFS（Hortonworks Sandbox 2.4）。我目前只使用 2 个处理器：GetHTTP 和 PutHDFS。

我似乎将两个处理器都配置好了...它们运行了，但是我找不到通过 Ambari 进入 Hadoop 时创建的输出文件...我已将输出目录设置为 /user/，但什么也没有出现。但是，我在 PutHDFS 处理器上收到一条警告消息，建议：

...所以必须在某处写入文件。我尝试改变指定 xml 和 JSON 格式的 API 调用，但没有明显区别。

我想我必须要么需要在 NiFi 中的管道中添加一些处理，要么我在沙箱中寻找错误的位置。有人可以建议吗？

hadoop apache-nifi hortonworks-sandbox

2017-01-08T23:46:03.703

0 投票

1 回答

903 浏览

hadoop - 如何将文件从 ubuntu 桌面传输到 hortonworks 沙箱

我的 ubuntu 的本地桌面上有一个 jar 文件。想转移到在 vm player 中运行的 Hortonworks 沙箱。在 windows 中我们有 wincp 来执行它。我不知道如何在 ubuntu 中执行它。能否请你帮忙。

hadoop hortonworks-data-platform hortonworks-sandbox

2017-01-09T04:53:05.880

0 投票

0 回答

56 浏览

json - 使用 Pig 操作 json 文件

我已经将一个 json 文件调用到 HDFS（在虚拟机上运行的 HDF 2.4 沙箱），现在我想使用 Pig 来操作文件中的数据。

我开始尝试定义模式以使用 JsonLoader 将文件传递给 Pig，但是当我在某个地方读到 Pig 无法处理多行文件时放弃了这一点，我怀疑这可能是（这是我第一次使用json 并且数据文件的结构非常复杂 - 它是 5 天的 3 小时天气预报数据，来自 Met Office api ( http://www.metoffice.gov.uk/datapoint/product/uk-3hourly-site -特定预测）。

我的问题是：将这些数据简单地导入 Pig 以便我可以开始操作它的最快、最简单的方法是什么？

我碰巧我的手臂运行了以下脚本来加载文件，但由于文件只有 4.3Kb，并且脚本现在已经运行了超过 15 分钟，没有结果或生成日志，我得出的结论是这种方法没有成功了：

非常感谢任何指导谢谢。

json apache-pig hortonworks-sandbox

2017-01-11T22:19:12.377

0 投票

1 回答

154 浏览

json - 使用 Nifi 构建摄取的 json 数据的可能性

是否可以使用 Nifi 将 json 文件加载到结构化表中？

我调用了以下天气预报数据（来自 6000 个气象站），我目前正在将其加载到 HDFS 中。这一切都出现在一行中：

理想情况下，我希望将架构构造成一个 6000 行的表。

我尝试编写一个模式将上述内容传递给 Pig，但没有成功，可能是因为我对 json 不够熟悉，无法正确翻译。

寻找一种向数据添加一些结构的简单方法，我发现 Nifi 中有一个 PutHBaseJson 处理器。

谁能建议这个 PutHBaseJson 处理器是否适用于上述数据结构？如果是这样，任何人都可以向我指出一个体面的教程，给我一个配置的起点吗？

非常感谢任何指导。

json hadoop apache-nifi hortonworks-sandbox

2017-01-13T00:10:58.930

0 投票

1 回答

658 浏览

hortonworks-data-platform - 如何让 Ambari 服务自动启动

我正在实现 Ambari 服务，需要在集群启动后自动启动它。metainfo.xml 中是否有一些选项可以启用此功能？

hortonworks-data-platform ambari hortonworks-sandbox

2017-01-26T14:58:07.043

0 投票

1 回答

1909 浏览

mapreduce - 文本到字符串映射减少

我正在尝试在 Hortonworks Sandbox 中使用 mapreduce2(yarn) 拆分字符串。如果我尝试访问 val[1] ，它会引发 ArrayOutOfBound 异常，当我不拆分输入文件时可以正常工作。

映射器：

减速器：

主类：

你能帮我吗？

更新：

发现它不会将文本转换为字符串。

mapreduce hadoop2 hortonworks-sandbox

2017-02-03T23:15:04.857

0 投票

0 回答

108 浏览

json - Hive 不通过 Flume 查询存储在 hdfs 中的数据

我正在做一个大数据项目，并在 Hive 中创建了一个外部表，该表应该查询存储在 HDFS 中的数据。使用 Flume 将数据流式传输到 HDFS。但是，当我查询存储在 HDFS 中的数据时出现错误。所有权限似乎都可以。HDFS中存储数据的权限是-rw-r--r--

创建的表如下：

我花了几个小时寻找这个案例，但没有运气。正在生成的错误日志如下：

我只粘贴了错误日志的开头，因为它会生成一个巨大的日志。我很乐意感谢任何有关错误的帮助和指导。提前致谢。

json hadoop hive hdfs hortonworks-sandbox

2017-02-06T21:08:16.213

1 2 3 4 5 6 7 8 9 10

问题标签 [hortonworks-sandbox]

Reference