我是迪德尔的新手。我到处寻找可以帮助我完成以下任务的示例:
- 使用多列索引数据框(示例中为 3 - 日期、ID 和标题)
- 将多个数据框中的数字列一起添加(示例中的销售列)
- 将同一天发生的销售分组并加在一起
我目前的方法如下。首先 - 由于缺少值,它不起作用,我不知道如何在添加数据帧时轻松处理它们。第二 - 我想知道是否有更好更优雅的方式来做到这一点。
// Remove unused columns
var df = dfRaw.Columns[new[] { "Date", "ID", "Title", "Sales" }];
// Index data frame using 3 columns
var dfIndexed = df.IndexRowsUsing(r => Tuple.Create(r.GetAs<DateTime>("Date"), r.GetAs<string>("ID"), r.GetAs<string>("Title")) );
// Remove indexed columns
dfIndexed.DropColumn("Date");
dfIndexed.DropColumn("ID");
dfIndexed.DropColumn("Title");
// Add data frames. Does not work as it will add only
// keys existing in both data frames
dfTotal += dfIndexed
表格1
Date,ID,Title,Sales,Market
2014-03-01,ID1,Title1,1,US
2014-03-01,ID1,Title1,2,CA
2014-03-03,ID2,Title2,3,CA
表 2
Date,ID,Title,Sales,Market
2014-03-02,ID1,Title1,2,US
2014-03-03,ID2,Title2,2,CA
预期成绩
Date,ID,Title,Sales
2014-03-01,ID1,Title1,3
2014-03-02,ID1,Title1,2
2014-03-03,ID2,Title2,5