我有 2 个带有 1 列“v”的 csv 数据集。这两个文件中的数据完全相同。“v”列包含将转换为十进制的值?在执行标准开发之前。
两个数据集中的 sum(v)、avg(v) 值相同,但 stdev 值不匹配。这怎么可能?
这是代码,
@ds1 =
EXTRACT v decimal?
FROM @ds1_path
USING Extractors.Csv(skipFirstNRows : 1);
@ds2 = EXTRACT v decimal?
FROM @ds2_path
USING Extractors.Csv(skipFirstNRows : 1);
@data =
SELECT STDEV(v) AS stdev,
SUM(v) AS sum,
AVG(v) AS avg,
VAR(v) AS vari,
"ds1" AS type
FROM @ds1
UNION ALL
SELECT STDEV(v) AS stdev,
SUM(v) AS sum,
AVG(v) AS avg,
VAR(v) AS vari,
"ds2" AS type
FROM @ds2;
这给出了以下输出。如果您注意到 sum, avg 值完全相同,但 VAR 和 STDEV 值不匹配。
有人可以帮忙吗?