问题标签 [cloudera-quickstart-vm]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
487 浏览

linux - 安装 RODBC 包时出错

我正在尝试在我的 Cloudera 服务器上安装 RODBC,但是在下载软件包时出现错误...有没有人可以告诉我我做错了什么?

在我的日志下面:http: //pastebin.com/s2b1y0Xr

0 投票
0 回答
257 浏览

python - 如何读取存储在 cloudera 主文件夹中的文件

我是 python 和 spark 的新手,我已经安装了 cloudera quickstart,我正在尝试读取我在 cloudera 的主文件夹中创建的文件,该文件存在于 cloudera 分发桌面中,我该如何读取该文件?

我尝试使用以下命令读取文件

是否有任何特定格式需要编写命令,或者我应该将文件存储在其他地方。

我在这里错过了什么吗?

0 投票
1 回答
828 浏览

hadoop - 压缩配置单元外部表中的Json数据,当时查询抛出异常?

0 投票
1 回答
241 浏览

hadoop - 访问在 Ubuntu 主机上运行的 Cloudera VM 上的 RStudio 服务器

我想做的事:访问 RStudio WebGUI,从 OSX 浏览器在 Ubuntu 主机上的 Cloudera Quickstart VM 上运行。

这是有效的: 1. Ubuntu 主机正在运行 Cloudera Quickstart VM 2. Cloudera VM 已安装并运行 R 和 RStudio Server。可从 Cloudera VM 访问 WebGUI。

我不能:我无法从我的 OSX 浏览器访问我的 WebGUI。它只是超时。

有趣的是,我可以通过端口访问主机 IP 上 VM 上的 Cloudera Manager,但我无法通过同一 IP 访问 VM 上的 RStudio 服务器。关于我应该从哪里开始的任何线索?

0 投票
2 回答
851 浏览

eclipse - 带有 POM 的 SparkSQL-Scala

Cloudera VM 和 Spark 有一些问题。首先,我是 Spark 的新手,我的老板要求我在虚拟机中在 Scala 上运行 Spark 以进行一些测试。

我已经在 Virtual Box 环境中下载了虚拟机,所以我打开了 Eclipse,我在 Maven 上有了一个新项目。不知不觉中,我之前运行了 Cloudera 环境并启动了所有服务,如 Spark、Yarn、Hive 等。Cloudera 服务中的所有服务都运行良好,并且所有检查都是绿色的。我用 Impala 做了一些测试,效果很好。

在 Eclipse 和 Scala-Maven 环境下,事情变得最糟糕:这是我在 Scala 中的非常简单的代码:

测试非常简单,因为存在“产品”表:如果我在 Impala 上复制并粘贴相同的查询,查询就可以正常工作!

在 Eclipse 环境中,否则,我会遇到一些问题:

主要错误是(对我来说):

我在其他网站和文档上搜索,发现问题与 Hive 表有关……但我不使用 Hive 表,我使用 SparkSql……

任何人都可以帮助我吗?感谢您的任何回复。

0 投票
1 回答
273 浏览

hadoop - 手动下载 cloudera docker 镜像

我希望在我的笔记本电脑上安装 cloudera docker 映像,它说文件大约 4gb,我的互联网连接速度很慢,所以我手动搜索下载映像,我发现 - http://www.cloudera.com/documentation /enterprise/5-5-x/topics/quickstart_docker_container.html

在此处输入图像描述

在上图中,它表示我们可以从网站下载图像。所以我去http://www.cloudera.com/downloads/quickstart_vms/5-7.html选择 docker 镜像作为平台并登录,然后点击立即下载。

它说您的下载将自动开始,或者单击此处,然后它将我重定向到https://hub.docker.com/r/cloudera/quickstart/,即使在页面源中它的链接的 href 也是如此。谁能帮我下载链接。谢谢!

0 投票
1 回答
557 浏览

machine-learning - 在 Cloudera VM 5.7 和

我正在学习 hadoop、机器学习和 spark。我已经下载了 Cloudera 5.7 快速启动 VM。我还从https://github.com/apache/spark下载了示例作为 zip 文件并将它们复制到 Cloudera VM。我在运行机器学习和 https://github.com/apache/spark中的任何示例时遇到了挑战。我尝试运行简单的字数统计示例,但失败了。以下是我的步骤和我得到的错误

[cloudera@quickstart.cloudera] cd /spark-master/examples/src/main/python/ml [cloudera@quickstart.cloudera] spark-submit word2vec_example.py

我尝试运行的所有示例都失败并出现以下错误。

Traceback(最近一次调用最后一次):文件“/home/cloudera/training/spark-master/examples/src/main/python/ml/word2vec_example.py”,第 23 行,从 pyspark.sql 导入 SparkSession

我搜索了文件 pyspark.sql 但我只能找到以下文件 cd /spark-master find 。-name pyspark.sql ./python/docs/pyspark.sql.rst

请告知我如何解决这些错误,以便我可以运行此示例以加速我的机器学习和大数据。

字数统计示例的代码如下

猫 word2vec_example.py

0 投票
0 回答
379 浏览

r - 无法使用 rimpala.connect() 在 Impala 和 Rstudio 之间建立连接

我无法在 Impala 和 RStudio 之间建立连接。

我正在为 Cloudera Manager 和 RStudio 使用 Cloudera quickstart vm

请参阅下面的代码并告知是否可以做任何事情:

初始化

输出

连接

输出

0 投票
2 回答
440 浏览

docker - 无法在 Docker 中停止 cloudera/quickstart

我尝试使用停止运行cloudera/quickstart的容器

但它并没有停止并且永远存在(什么都没有发生)。如果我尝试使用删除它,也会发生同样的事情

我怎样才能停止/删除这个容器?谢谢。

0 投票
0 回答
928 浏览

apache-spark - 在 CDH 5.7 中运行 spark-shell 时出错

我是 Spark 的新手,使用 CDH-5.7 运行 Spark,但是当我在终端中运行 Spark-shell 时出现这些错误,我也通过 Launch Cloudera Express 运行了包括 Spark 在内的所有 Cloudera 服务。请帮忙。