问题标签 [hadoop-partitioning]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

338 问题

0 投票

4 回答

905 浏览

hadoop - 新用户 SSH hadoop

在单节点集群上安装hadoop，知道为什么我们需要创建以下内容

为什么我们需要新用户的 SSH 访问权限..？
为什么它应该能够连接到自己的用户帐户？
为什么我应该为新用户指定密码少..？
当所有节点都在同一台机器上时，为什么它们要显式通信..？

http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/

2013-07-23T08:45:56.713

0 投票

0 回答

2649 浏览

hadoop - 从 Hive 中的现有非分区表创建具有动态分区的新表

我在 HIVE 中有现有的表结构，它具有各种字段，例如（a 字符串、b 字符串、tstamp 字符串、c 字符串），包括一个 tstamp 字段。

我需要从现有表（original_table）创建一个新的分区表（table_partitioned），但现在这个新表结构应该根据“tstamp”字段的日期部分进行分区。

为了解决这个问题，我创建了一个类似于现有表结构的新表模式，并使用以下查询添加了一个名为“date_string”的分区列：-

然后我尝试使用以下插入查询将数据插入“table_partitioned”：-

但是上面的插入语句会遇到如下各种错误：-

如果我通过在下面的 Insert 语句中放置 where 子句仅加载一些数据，那么它会为匹配的行创建分区：-

注意：- 我每天有大约 2,00,000 个数据条目，例如 2013 年 7 月 23 日，而 original_table 有 2 年健全的数据。

我怎样才能一次插入所有数据，我是否遗漏了什么？

hadoop hive hadoop-partitioning

2013-07-23T20:14:05.317

0 投票

1 回答

5722 浏览

hadoop - 在 hadoop 多节点集群上启动 HDFS 守护程序时出错

Hadoop多节点设置时的问题。一旦我在Master上启动我的hdfs恶魔（bin / start-dfs.sh）

我确实得到了以下关于大师的日志

我确实得到了以下奴隶@的日志

hadoop-hduser-datanode-localhost.localdomain.log 文件

有人可以告诉我，设置有什么问题。

hadoop hadoop-streaming hadoop-plugins hadoop-partitioning

2013-07-24T07:03:48.350

0 投票

1 回答

1309 浏览

hadoop - DiskErrorException on slave machine - Hadoop multinode

I am trying to process XML files from hadoop, i got following error on invoking word-count job on XML files .

i observer following error at hadoop-hduser-tasktracker-localhost.localdomain.log file on slave machine .

This works fine when i ran for text files

hadoop mapreduce hadoop-streaming hadoop-plugins hadoop-partitioning

2013-07-25T07:19:34.413

0 投票

1 回答

5853 浏览

hadoop - Hadoop 网络用户：没有这样的用户

在运行 hadoop 多节点集群时，我在主日志上收到以下错误消息，有人可以建议该怎么做..？我需要创建一个新用户还是我可以在这里给我现有的机器用户名

2013-07-25 19:41:11,765 警告 org.apache.hadoop.security.UserGroupInformation：没有可供用户网络用户使用的组 2013-07-25 19:41:11,778 警告 org.apache.hadoop.security.ShellBasedUnixGroupsMapping：出现异常试图获取用户 webuser org.apache.hadoop.util.Shell$ExitCodeException: id: webuser: No such user 的组

hdfs-site.xml 文件

核心站点.xml

mapred-site.xml

我跟着http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-multi-node-cluster/。

Hadoop 1.2.0 码头-6.1.26

添加我的 hdfs-site.xml 后看起来

hadoop mapreduce hadoop-streaming hadoop-plugins hadoop-partitioning

2013-07-25T15:45:47.603

0 投票

2 回答

1348 浏览