我正在寻找一个RDD和一个cassandra表的连接,它们对于同一个键ex(简化)具有不同的名称:
case class User(id : String, name : String)
和
case class Home( address : String, user_id : String)
如果想做:
rdd[Home].joinWithCassandraTable("testspark","user").on(SomeColumns("id"))
我怎样才能精确地确定要在其上进行连接的字段的名称。而且我不想将 rdd 映射为只有正确的 id,因为我想在 joinWithCassandraTable 之后加入所有值。