我尝试在带有 mongo spark 连接器的 mongodb 中使用类型为“密集向量”的列编写我的数据框。
但我收到此错误:
不能将 [2.0,2.0,115.0,0.0,0.0,0.0,0.0,0.0] 转换为 BsonValue。org.apache.spark.ml.linalg.VectorUDT@3bfc3ba7 没有匹配的 BsonValue。
但为什么不将其转换为 Array[Double],请参阅:https ://docs.mongodb.com/manual/reference/bson-types/
我的数据框架构:
root
|-- label: double (nullable = false)
|-- date: timestamp (nullable = true)
|-- features: vector (nullable = true)