0

我正在使用Mobius(Spark 的 C# 语言绑定)和 MongoDB 的 C# 驱动程序。我的目标是在我的 C# 应用程序中使用 MongoDB 作为 Spark 查询的输入/输出。我知道有一个 Java MongoDB Hadoop 连接器,但我想继续使用 Mobius 来编写我的 Spark 查询。

4

1 回答 1

0

您可以使用Mobius中的MongoDB Spark 连接器和 DataFrame API来查询 MongoDB。加载数据的代码如下所示

var mongoDbDataFrame = sqlContext.Read.Format("com.mongodb.spark.sql").Load()

加载数据后,您可以对 DataFrame 执行 Select()、Filter() 操作。您还可以使用下面的代码模板将 DataFrame 注册为 TempTable 以使用 SQL 查询

mongoDbDataFrame.RegisterTempTable("MongDbDataFrameTempTable")
sqlContext.Sql("SELECT <columns> FROM MongDbDataFrameTempTable WHERE <condition>")

请注意,您需要在类路径中包含连接器及其依赖项,并且可以使用“--jars”参数。

于 2016-07-12T21:51:22.347 回答