我正在为其他想知道 Linq-DataView 与非 Linq-DataView 性能如何的人进行比较,特别是因为结果让我感到惊讶。对于这个测试,至少,旧的 DataView 比启用 Linq 的 DataView 快一个数量级。
v1: Linq-DataView, on-the-fly sort string -> OrderBy/ThenBy via Field<dynamic>()
v2: Linq-DataView, on-the-fly via mapped Field<type>()
v3: Linq-DataView, hard-coded OrderBy/ThenBy
v4: non-Linq DataView w/sort string
无类型 dtbl 的 Linq-DataView 与非 Linq-DataView(秒)
03.411 v1 = dtbl.AsEnumerable().OrderBy("T30y, Dat desc").AsDataView();
02.561 v2 = dtbl.AsEnumerable().OrderBy(dtbl, "T30y, Dat desc").AsDataView();
01.573 v3 = dtbl.AsEnumerable().OrderBy(y=>y.Field<decimal>("T30y"))
.ThenByDescending(y=>y.Field<DateTime>("Dat")).AsDataView();
00.214 v4 = new DataView(dtbl, "", "T30y, Dat desc", DataViewRowState.CurrentRows);
02.403 v1: 100,000 iterations of Find()
01.708 v2: 100,000 iterations of Find()
01.173 v3: 100,000 iterations of Find()
00.261 v4: 100,000 iterations of Find()
v2 的 OrderBy(带有 v1 的内嵌注释)
static public EnumerableRowCollection<DataRow>
OrderBy( this EnumerableRowCollection<DataRow> ys, DataTable dtbl, string sort )
{
OrderedEnumerableRowCollection<DataRow> oys = null;
foreach ( string s in (sort ?? "").Split(new []{", "}, StringSplitOptions.None) )
{
int n = s.IndexOf(" desc");
string x = n!=-1 ? s.Substring(0, n) : s;
Type typ = dtbl.Columns[x].DataType;
Func<DataRow,dynamic> vfn = y=>yget[typ](y,x); // v1: vfn = y.Field<dynamic>(x)
if ( oys==null )
oys = s.Contains(" desc") ? ys.OrderByDescending(vfn) : ys.OrderBy(vfn);
else oys = s.Contains(" desc") ? oys.ThenByDescending(vfn) : oys.ThenBy(vfn);
}
return oys ?? ys;
}
static Dictionary<Type,Func<DataRow,string,dynamic>>
yget = new Dictionary<Type,Func<DataRow,string,dynamic>>
{
{typeof(bool), (y,x)=>y.Field<bool>(x)},
{typeof(short), (y,x)=>y.Field<short>(x)},
{typeof(int), (y,x)=>y.Field<int>(x)},
{typeof(string), (y,x)=>y.Field<string>(x)},
{typeof(decimal), (y,x)=>y.Field<decimal>(x)},
{typeof(float), (y,x)=>y.Field<float>(x)},
{typeof(double), (y,x)=>y.Field<double>(x)},
{typeof(DateTime), (y,x)=>y.Field<DateTime>(x)},
{typeof(TimeSpan), (y,x)=>y.Field<TimeSpan>(x)},
};
如果有人看到这一点并且可以建议一种映射 datacolumns -> Field lambdas 而不依赖于 Func<> 返回动态类型的方法,那么任何建议都将受到欢迎。