我正在尝试在没有 cloudera 管理器的情况下在我的本地计算机(32 位 ubuntu)上安装 cloudera impala(它们不支持 32 位 ubuntu,我也尝试过但失败了)。
我尝试了以下命令从存储库下载 impala。
$ sudo apt-get install impala-shell
$ sudo apt-get install impala # Binaries for daemons
$ sudo apt-get install impala-server # Service start/stop script
$ sudo apt-get install impala-state-store # Service start/stop script
到这里为止它工作得很好。我的 impala/conf/hive-site.xml 看起来像这样
<property>
<name>hive.metastore.local</name>
<value>false</value>
</property>
<property>
<name>hive.metastore.uris</name>
<value>thrift://localhost:9083</value>
</property>
<property>
<name>hive.metastore.client.socket.timeout</name>
<value>3600</value>
<description>MetaStore Client socket timeout in seconds</description>
</property>
我的 impala/conf/hdfs-site.xml 看起来像这样。
<property>
<name>dfs.client.read.shortcircuit</name>
<value>true</value>
</property>
<property>
<name>dfs.domain.socket.path</name>
<value>/var/run/hadoop-hdfs/dn._PORT</value>
</property>
<property>
<name>dfs.client.file-block-storage-locations.timeout</name>
<value>3000</value>
</property>
现在,我试图连接到 impala-shell 上的 localhost。但是,它给了我这个错误
Error connecting: <class 'thrift.transport.TTransport.TTransportException'>, Could not connect to localhost:21000
仅供参考,我正在使用 mysql 作为我的 hive-hadoop 集群的元存储。