我目前是 .NET for Spark 的新手,需要将 C# 列表附加到增量表。我假设我首先需要创建一个 Spark DataFrame 来执行此操作。在示例代码中,我将如何将“名称”附加到数据框“df”?
现在看来,这已被弃用(https://github.com/Microsoft/Mobius),使用 RDD 不适用于新版本(https://github.com/dotnet/spark)
using System.Collections.Generic;
using Microsoft.Spark.Sql;
namespace HelloSpark
{
class Program
{
static void Main(string[] args)
{
var spark = SparkSession.Builder().GetOrCreate();
var df = spark.Read().Json("people.json");
df.Show();
var names = new List<string> { "john", "20" };
}
}
}
示例文件 people.json 如下所示:
{"name":"Michael"}
{"name":"Andy", "age":"30"}
{"name":"Justin", "age":"19"}