“mean”的相关标签问题_Stack Overflow中文网

0 投票

4 回答

19188 浏览

r - 计算组平均值、总和或其他汇总统计数据。并将列分配给原始数据

我想在分组变量（“组”）的每个级别内计算数值变量（“值”）的mean（或长度为 1 的任何其他汇总统计数据，例如、min、max）。lengthsum

应将汇总统计量分配给与原始数据具有相同长度的新变量。也就是说，原始数据的每一行都应该有一个对应于当前组值的值——数据集不应该折叠到每组一行。例如，考虑 group ：mean

前

后

2011-05-19T04:03:23.033

0 投票

1 回答

895 浏览

python - 在 numpy 中执行多种方法

早上好，我正在使用 Cressman 过滤器在 Numpy 中进行距离加权平均。我使用 Ball Tree 实施（感谢 Jake VanderPlas）返回请求数组中每个点的位置列表。查询数组（q ) 是形状 [n,3] 并且在每个点都有 x,y,z 点我想要对存储在树中的点进行加权平均.. 包裹在树周围的代码返回一定距离内的点所以我得到一个可变长度数组的数组。我使用 where 来查找非空条目（即在影响半径内至少有一些点的位置）创建 isgood 数组...

然后我遍历所有查询点以返回值 self.z 的加权平均值（请注意，这可以是 dims=1 或 dims=2 以允许多个共同网格化）

所以使用 map 或其他更快的方法复杂化的事情是 self.distances 和 self.locations 中数组长度的不均匀性......我对 numpy/python 仍然相当陌生，但我想不出办法这个数组明智（即不恢复到循环）

所以...有关如何加快循环的任何提示？...

对于将天气雷达数据从范围、方位角、仰角网格映射到笛卡尔网格的典型映射，我有 240x240x34 点和 4 个变量需要 99 秒来查询树（由 Jake 在 C 和 cython 中编写。这是艰难的一步，因为您需要搜索数据！）和 100 秒来进行计算......在我看来这很慢？我的开销在哪里？np.mean 是有效的还是被称为数百万次的，这里是否有加速？我会通过使用float32而不是default64来获得......甚至缩放到整数（这将很难避免在加权中回绕......任何提示都非常感激！

python performance numpy interpolation mean

2011-06-03T15:23:56.903

0 投票

1 回答

562 浏览

sql-server - 在 SQL Server 中使用 MODE 进行标准差

我正在尝试使用 MODE 的 1.65 (90%) 标准偏差来消除一组异常值，而不是 MEAN，出于各种原因，我现在不会讨论。

有没有这样做的好方法？我假设内置的 STDVE() 使用了 MEAN。有谁知道这是在幕后做什么，所以我可以基于它构建自己的功能，但对于 MODE？

在此先感谢，尼克

sql-server mode mean outliers standard-deviation

2011-06-20T08:45:29.597

0 投票

1 回答

7246 浏览

python - scipy stats 几何平均值返回 NaN

我正在使用 scipy 的 gmean() 函数来确定包含电压输出的 numpy 数组的几何平均值。数字的范围在 -80.0 和 30.0 之间。目前，numpy 数组是二维的，为两种不同的测量提供电压。

但是，当我采用几何平均值时，我得到 NaN：

有人知道可能是什么原因造成的吗？难道我做错了什么？

提前致谢！

python statistics numpy scipy mean

2011-07-17T19:42:40.010

0 投票

2 回答

394 浏览

r - 根据大型数据集中的平均值分配通过/失败值

这可能是一个简单的问题，但我希望有人能指出我正确的方向。我有一个示例数据集：

J 列指定了在 K 中定义的变量的类型。我希望能够取 K 值旁边分配有 1 的平均值。在此示例中，它将是 10 和 17

接下来，我希望能够分配通过/失败等级，其中通过 = 1，失败 = 0 来确定 K 列中的数字是否大于平均值。

最终数据集应如下所示：

这似乎很基本，对不起，伙计们，我只是不知道我在想什么。

r conditional mean

2011-07-22T08:32:18.520

0 投票

3 回答

2536 浏览

matlab - 如何计算 4D 图像数据的平均值和最大值？

我有一些 4D 图像数据，384×276×20×5，其中data(X,Y,T,V), X = x location, Y = y location, T = time, V = vessel location.

我想有一个随时间变化的平均值和随时间变化的最大值，以获得我的信号模式，从而设置我的阈值。我在循环中进行，所以我可以说，例如data(1,1,:,1)，随着时间的推移该点的平均值。

我试过了mean(data(X,Y,:,V))，mean(squeeze(data(X,Y,:,V)))但它给了我错误“下标索引必须是真正的正整数或逻辑。”

我到处搜索，但平均值的示例仅适用于 2D 和 1D。我认为，如果我想随时间获得数据的平均值/最大值，那么数据data(X,Y,:,V)就是现在的 3D 数据。

关于如何做到这一点的任何帮助或想法？

matlab multidimensional-array max mean

2011-07-22T13:37:20.857

0 投票

2 回答

1608 浏览

r - 多次随机子集数据集并计算均值和方差

我从来没有得出任何结论：这个问题，所以我想我会改写它并再次问。

我想对我的数据集进行 10,000 次二次抽样，以便为我的每个响应生成均值和 95% 的 CI。

以下是数据集结构的示例：

我只想对每个研究/变量组合进行一次二次抽样。因此，例如，子集数据集将如下所示：

请注意，第 3 行和第 6 行已经消失，因为它们都测量了一个变量两次（第一种情况是 B，第二种情况是 A）。

我想一次又一次地绘制二次抽样数据集，因此我可以推导出 value1 和 value2 的整体均值，每个变量的置信区间为 95%。所以在整个子采样例程之后我想要的输出是：

这是我必须获取子集的一些代码：

任何帮助表示赞赏。我知道这很复杂，所以如果您需要澄清，请告诉我！

r subset mean confidence-interval

2011-07-25T14:41:30.000

0 投票

2 回答

517 浏览

subset - 随机选择增加的数据子集以查看均值趋于平稳的位置

任何人都可以请建议执行以下操作的最佳方法吗？

我有三个变量（X、Y 和 Z）和四个组（1、2、3 和 4）。我一直在 SPSS 中使用判别函数分析来预测已知分组数据的组成员资格，以用于未来的未分组数据。

理想情况下，我希望能够对越来越多的数据子集进行随机抽样，以查看需要多少次观察才能达到所需的正确分类百分比。

但是，我知道这可能很困难。因此，我正在寻找这样做的手段。

例如，假设变量 X 对于第 1 组的平均值为 141。这个平均值可能是根据 2000 次观察计算得出的。但是，平均值可能出现在 700 次观察中。我希望能够计算出我的数据中平均水平的观察/案例数量。例如，可能从 10 次观察开始并随机重复 50 或 100 次，然后增加到 20 次观察......等等。

我知道这是蒙特卡罗测试的一种形式。我可以访问 SPSS 15、17 和 18 以及 excel。我还可以访问 minitab 15 & 16 和 amos17 并下载了“R”，但我不熟悉这些。我的经验是使用 SPSS 和 excel。我已经在 SPSS Modified from this..http://pages.infinit.net/rlevesqu/Syntax/RandomSampling/Select2CasesFromEachGroup.txt 中尝试了一些语法，但这对我来说输入子集号等仍然很耗时。

希望有人可以提供帮助。

谢谢阅读。

安迪

subset montecarlo spss sampling mean

2011-08-04T12:17:44.873

0 投票

3 回答

3389 浏览

c++ - 查找用户输入的几何平均值

我正在为一个班级做一个项目，我在输出几何平均值时遇到了麻烦，它总是为 1，我确信这是不对的。

这是我的代码：

c++mean

2011-09-02T16:57:07.893

0 投票

3 回答

238 浏览

c++ - 通过函数传递数组

我试图通过一个函数传递一个简单的数组来计算平均值。

现在代码只取最后输入的数字的平均值。

c++arrays mean

2011-09-08T22:32:18.987

问题标签 [mean]

Reference