问题标签 [standard-deviation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
bash - awk 搜索和计算标准差不同的结果
我正在努力获取 sar 的输出并计算列的标准偏差。我可以使用文件中的单个列成功执行此操作。但是,当我在一个文件中计算同一列时,我正在剥离标题行和平均行等“坏”行,它给了我一个不同的值。
以下是我正在执行此操作的文件:
/tmp/saru.tmp
/tmp/sarustriped.tmp
基于 /tmp/saru.tmp 的计算:
基于 /tmp/sarustriped.tmp 的计算(正确的)
有人可以帮助并告诉我为什么这些结果不同,有没有办法使用单个 awk 命令获得更正的结果。我试图这样做是为了提高性能,因此最好不要使用像 grep 这样的单独命令或其他 awk 命令。
谢谢!
更新
所以我尝试了这个......
它适用于我正在使用的 sar -u 输出。我不明白为什么它不能与其他“列表”一起使用。简而言之,尝试使用 sar -r 第 5 列。它再次给出了错误的答案……输出给出了 1.68891,但实际偏差为 0.107374……这与使用 sar -u 的命令相同。 ....如果您需要我可以提供的文件。只是不确定如何发表新的“完整”评论……所以我只是编辑了旧评论……谢谢!
bayesian - 具有零标准偏差的概率密度函数
我现在正在使用朴素贝叶斯算法实现一个电子邮件过滤应用程序。我的应用程序使用来自 UCI 机器学习存储库的 Spambase 数据集。由于属性是连续的,我使用概率密度函数 (PDF) 计算概率。但是,当我使用 k 折交叉验证评估数据时,训练集的其中一个属性可能只包含 0。出于这个原因,我得到了 0 标准差,PDF 返回 NaN,这导致大量垃圾邮件没有正确分类到该训练集。我应该怎么做才能解决问题?
cuda - 使用 CUDA 的标准差
我正在编写一个代码来查找 6 个向量的均值和标准差,每个向量有 8000 个元素。我想知道我是否可以使用 CUDA 来加快操作速度。我可以想到如何使用 CUDA 找到平均值,但我无法理解如何使用 CUDA 计算标准差。任何人都可以在这里帮助我吗?
r - R-Project 中的条形图均值 /w SD
听起来很简单,但一些研究并没有提出一个优雅的解决方案:我有一个由分类变量(GROUP)和连续读出变量(血压)构成的数据框。如何制作一个简单的箱线图,显示每个组的平均值及其标准差?有多个组:A、B、C、D 如何在数据框中执行 ANOVA 事后分析。它如何与 Mann-Whitney-U-Test 一起使用?我可以在条形图中标记显着性水平吗?如何将此操作简化为多个连续变量(dia_bloodpressure、sys_bloodpressure、mean_bloodpressure)和 sink() 不同文件中的输出(按变量名称)?
statistics - 使用 BigQuery 结合 WHERE 子句查找具有标准差结果的异常值
标准偏差分析可能是查找异常值的有用方法。有没有办法合并这个查询的结果(找到远离平均值的第四个标准偏差的值)......
结果 = 12.721342001626912
...进入另一个查询,该查询生成有关哪些州和日期的大多数婴儿出生时体重与平均值相差 4 个标准差的信息?
结果:
本质上,将它组合成一个查询会很棒。
c# - 如何将针对标准偏差编码为 1 的逆 CDF 转换为不同的 STDDEV?
作为使用逆累积分布函数 (CDF) 进行数值积分的算法的一部分,我正在做拒绝抽样。
我发现了两种可能的实现:
- 在 C 和 Java 中(以及其他,但不是 C#,所以我需要翻译):
http://home.online.no/~pjacklam/notes/invnorm/
- 在 C# 中,有 StatisticFormula.InverseNormalDistribution(在 System.Windows.Forms.DataVisualization.Charting 中)。鉴于微软多年前在 Excel 中执行不良 NORMINV 的记录,我对此持怀疑态度。
这两个函数都假定均值为零(我将使用它)和标准偏差为 1。如何转换此函数的输入和/或输出,以使标准偏差不同于一个?
我知道高斯分布:
f(x,mean,sd) = (1/(sd*sqrt(2*pi))) exp(-0.5 ((x-mean)/sd)^2)
因此,如果我有 g(x) = f(x,0,1),则 f(x,mean,sd) = (1/sd)*g(x/sd)。
将 Gaussian 转换为不同的 Std Dev 很容易。我可以为逆 CDF 做类似的事情吗?
parsing - 基于二次舍入域显着性的值域awk舍入
我想接受以下输入
Average Box 1: 0.520522 Std. Dev. Box 1: 0.00297154
...打印舍入到某个数字的第一个数字(平均值),其中该数字由 ROUNDED 标准的第一个有效数字定义。开发。
例如 --> Rounded Std 0.003 <-- (所以第三个数字)
--> 0.521 (在这种情况下)
给出一个边界情况:
Average Box 1: 0.52156 Std. Dev. Box 1: 0.0099675
--> Rounded Std 0.01 <-- (所以第二个数字)
--> 0.52 (在这种情况下)
我可以通过某种方式的 Awk 魔法来完成这一切吗?如果是这样,怎么做?如果没有,我可以用什么来做(我最后的手段是 C 程序,但 shell 程序似乎更有效)?
(这是用于研究项目的数据提取,又名 /nothomework。)
arrays - Matlab - 笛卡尔点的标准偏差
我有一个笛卡尔点数组(第 1 列是 x 值,第 2 列是 y 值),如下所示:
我将如何获得积分的标准偏差?它将与平均值进行比较,平均值是一条直线。这些点不是那条直线,因此标准偏差描述了线段与直线的波浪或“偏离基准”程度。
我真的很感激帮助。
r - 直方图中每个 bin 的均值和标准差
我在 R 中有一些代码,可以在 R 中生成关于机器在不同时间点的不同功率(瓦特)值的频率的直方图。
直方图被划分为“n”个箱或单元。
有没有一种简单的方法来计算每个箱中的平均值和标准偏差?
例如,
有任何想法吗?
matlab - 如何在matlab中计算没有循环的类内标准差?
我有一个数据集,其中有 n 个样本 d 个特征,由一个 *d 矩阵表示。对应的标签是一个*1的向量。如何在matlab中计算没有循环的每个类内标准差?
例如:
样品
标签:
如何计算 1 类和 2 类的标准差?