我正在使用 cassandra 2.0.3,我想使用 pyspark(Apache Spark Python API)从 cassandra 数据创建一个 RDD 对象。
请注意:我不想导入 CQL,然后从 pyspark API 进行 CQL 查询,而是想创建一个 RDD,我想在其上进行一些转换。
我知道这可以在 Scala 中完成,但我无法从 pyspark 中找出如何做到这一点。
如果有人可以指导我,我真的很感激。
我正在使用 cassandra 2.0.3,我想使用 pyspark(Apache Spark Python API)从 cassandra 数据创建一个 RDD 对象。
请注意:我不想导入 CQL,然后从 pyspark API 进行 CQL 查询,而是想创建一个 RDD,我想在其上进行一些转换。
我知道这可以在 Scala 中完成,但我无法从 pyspark 中找出如何做到这一点。
如果有人可以指导我,我真的很感激。