我想要类似的东西
$hive
> ADD FILE <directory_path>;
它将目录添加到配置单元的工作目录。
我正在使用配置单元 0.7。
我需要这个来添加映射器/减速器脚本使用的 python 包。
我有哪些选择?
我想要类似的东西
$hive
> ADD FILE <directory_path>;
它将目录添加到配置单元的工作目录。
我正在使用配置单元 0.7。
我需要这个来添加映射器/减速器脚本使用的 python 包。
我有哪些选择?
对于 0.7.1,您可以使用 shell 转义 (!)!hadoop fs -mkdir <path>
或“dfs”命令来运行dfs -mkdir <path>
。有关更多信息,请参阅cli wiki 页面。不确定这些是否在 0.7 中。
对我有用的是将所有内容(目录/文件)压缩到一个 zip 文件并使用“添加存档”,如将多个文件添加到 HIVE 中的分布式缓存中所述