全部,
我是Apache Spark V3.1.2的新手。我们正在将 Python 代码移植到Pyspark (v3.1.2)代码中,并且一些代码失败了。
后来,我遇到了Koalas,它是集群感知的,它是Pandas的替代品,我们正在重写那部分。同样,我们也遇到了 NLTK 的问题。
是否有文档包含 Pyspark 的 Apache Spark 集群感知库及其 python 等效库的列表?
如果有人能指出我正确的方向,那将是非常有帮助的。
请注意,我们有带有 CU13 的 SQLServer 2019 BDC。此可用软件包列表在链接中列出。
谢谢,
格拉吉