我有一个名为 article 的数据框
+--------------------+
| processed_title|
+--------------------+
|[new, relictual, ...|
|[once, upon,a,time..|
+--------------------+
我想把它弄平,把它变成一袋字。我怎么能用目前的情况来实现这一点。我已经尝试了下面的代码,这似乎给了我一个类型不匹配的问题。
val bow_corpus = article.select("processed_title").rdd.flatMap(y => y)
我最终想用这个 bow_corpus 来训练一个 word2vec 模型。
谢谢