我有一个DStream[String, Int
带有成对字数的 ],例如("hello" -> 10)
. 我想用步长索引将这些计数写入 cassandra。该索引被初始化为var step = 1
并随着每个微批处理的处理而递增。
cassandra 表创建为:
CREATE TABLE wordcounts (
step int,
word text,
count int,
primary key (step, word)
);
尝试将流写入表时...
stream.saveToCassandra("keyspace", "wordcounts", SomeColumns("word", "count"))
......我明白了java.lang.IllegalArgumentException: Some primary key columns are missing in RDD or have not been selected: step
。
如何将step
索引添加到流中以便将三列一起写入?
我正在使用 spark 2.0.0、scala 2.11.8、cassandra 3.4.0 和 spark-cassandra-connector 2.0.0-M3。