1

我想在 Apache Pig 中编写 UDF。我将使用 Python UDF。我的问题是我有大量数据需要分析,并且需要 NumPy 和 SciPy 等软件包。购买这个,他们没有 Jython 支持,我不能将它们与 Pig 一起使用。

我们有替代品吗?

4

1 回答 1

0

您可以通过导入 scipy 的 (C)Python 脚本进行流式传输。例如,我使用 import scipy.cluster.hierarchy 使用它来聚集包内的数据

于 2012-09-27T09:51:10.060 回答