Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
getShipFiles和getCacheFiles在课堂上有什么区别EvalFunc?
getShipFiles
getCacheFiles
EvalFunc
假设此方法中指定的任何文件都可用于exec分布式缓存中的方法
exec
getCacheFiles() 允许 UDF 指定它希望放置在分布式缓存中的 hdfs 文件列表。
getShipFiles() 允许 UDF 指定它希望放置在分布式缓存中的本地文件列表。
因此 getShipFiles 从本地文件中获取文件,而 Cache 从 HDFS 中获取文件。