2

我知道在 Scala 中,您可以读取 parquet 文件,如下所示:

//Create Spark Context
val sparkConf = new SparkConf().setAppName(appName).setMaster(sparkMaster)
val sc = new SparkContext(sparkConf)
val sqlContext = new SQLContext(sc)
import sqlContext.implicits._

 val pf = 
      sqlContext.read.parquet(hdfsDataUri + "test.parquet")
 pf.registerTempTable("test")

有没有办法使用 Mobius(C# API for Spark)来做到这一点?我只能找到一种读取 CSV 文件的方法。参考:https ://github.com/Microsoft/Mobius

4

2 回答 2

2

Mobius中提供了用于在 Apache Spark 中使用 Parquet 的 C# API。以下是您问题中 Apache Spark Scala 代码的 C# 实现:

        var sparkConf = new SparkConf().SetAppName(appName).SetMaster(sparkMaster);
        var sc = new SparkContext(sparkConf);
        var sqlContext = new SqlContext(sc);
        var pf = sqlContext.Read().Parquet(hdfsDataUri + "test.parquet");
        pf.RegisterTempTable("test");
于 2016-05-20T03:26:21.313 回答
2

您可以通过https://github.com/elastacloud/parquet-dotnet在 .NET 中直接读写 parquet 文件

于 2017-11-27T23:22:40.470 回答