0

getShipFilesgetCacheFiles在课堂上有什么区别EvalFunc

假设此方法中指定的任何文件都可用于exec分布式缓存中的方法

4

1 回答 1

1

getCacheFiles() 允许 UDF 指定它希望放置在分布式缓存中的 hdfs 文件列表。

getShipFiles() 允许 UDF 指定它希望放置在分布式缓存中的本地文件列表。

因此 getShipFiles 从本地文件中获取文件,而 Cache 从 HDFS 中获取文件。

于 2015-03-22T19:07:48.827 回答