“kurtosis”的相关标签问题_Stack Overflow中文网

0 投票

0 回答

394 浏览

matlab - 如何在 Matlab 中生成具有给定偏度、峰度、均值和标准差的分布？

我需要创建一些具有给定偏度、峰度、均值和标准偏差的分布。我通过这样做生成了一个正态分布：

有谁知道我怎样才能改变偏度和峰度？

我刚刚在网上找到了这个，它似乎有点诀窍：

例如

有什么方法可以控制均值和标准差？Tnx

谢谢大家

2019-09-25T12:21:46.203

0 投票

3 回答

2031 浏览

r - 在R中按年份计算偏斜和峰度

我有一个看起来像这样的表：

（“天”列不参与我的偏斜峰度计算，它只是在我的表中）

我想要一个计算按年份分组的偏斜和峰度值的表：

我不知道如何按年份对其进行分组以执行这些计算。

r skew group-summaries kurtosis

2019-10-21T17:42:08.000

0 投票

1 回答

244 浏览

python - 如何计算描述性统计；从数据集中选择特征的偏度和峰度？

我需要在 python 中正确地从数据框中找到所选特征的偏度和峰度。

目标（y）特征是我需要的选定特征。

块引用

python kurtosis

2019-11-12T08:25:19.680

0 投票

1 回答

642 浏览

python - 使用 for 循环计算峰度和偏度

我正在尝试计算不同领域的偏斜度和峰度。我想用每个字段名进入最终表。峰度和偏度。为此，我编写了下一个代码：

AttributeError：“str”对象没有属性“skew”

从信息中可以看出，我 100% 确定我的数据库中没有字符串：

我在这里看到了歪斜：http: //www.christianherta.de/lehre/dataScience/exploratory/intro-explorative-data-analysis.php

我的最终目标是创建一个包含每个字段的偏度和峰度数据的表。

python pandas distribution kurtosis

2019-11-25T10:28:38.890

0 投票

1 回答

125 浏览

python - 图表上显示峰度和偏度的错误

我在这个论坛中发现了一个代码，它假设计算并在直方图上显示偏度和峰度。

这是我在情节中使用的代码：

但我得到了一个错误：

ValueError：基于位置的索引只能有[整数，整数切片（开始点包含，结束点排除），整数列表，布尔数组]类型

我知道这里的问题是位置，可能是代码中写有 iloc 的部分，但我不知道如何解决它，我刚刚开始使用 python，所以解释越广泛，我遇到的问题就越少。 ..

我的最终目标是调整这些图表上的峰度和偏度

python pandas histogram kurtosis

2019-11-25T12:12:32.557

0 投票

1 回答

33 浏览

python - 仅在表格的一部分上进行计算

我正在尝试计算数据的峰度和偏度，并且我设法创建表，但由于某种原因，结果仅适用于少数列，而不适用于整个字段。

例如，如您所见，我有很多字段（列）：

我使用下面的代码计算 skenwess 和峰度：

但随后我得到的结果包含大约一半的数据：

我试图做 head(10) 但它并没有改变一些列消失的事实。

我怎样才能为所有列计算这个？

python pandas skew kurtosis

2019-11-25T13:37:19.603

0 投票

2 回答

38 浏览

r - R - 基于使用另一列的函数为一列添加值

我有一个看起来像这样的数据集

头部（数据集）

我想向峰度列添加值。要计算峰度，我需要按延迟时间对距离进行分组（即，延迟时间 1 的所有距离都会给我一个峰度值等）。为了得到峰度，我通常使用包“psych”和函数 describe() 有没有我可以添加的循环来做到这一点？

r loops kurtosis

2020-03-10T15:48:04.620

0 投票

1 回答

187 浏览

pyspark - 使用 pyspark 模块中的函数时峰度是否过高？

使用 pyspark 模块中的峰度函数时pyspark.sql.functions.kurtosis(col)，结果是否超过正态分布？IE。是否已经从峰度中减去 3 以产生 k-3？还是我们必须自己计算超出部分？

pyspark pyspark-sql kurtosis

2020-03-25T18:33:24.257

0 投票

2 回答

1145 浏览

numpy - 在 Python 中计算加权统计矩

我一直在寻找一个函数或包，它可以让我以加权方式计算分布的偏斜和峰度，因为我有直方图数据。

例如我有数据

其中第一列[1,2,3,4,5]是值，第二列[2,5,6,12,1]是值的频率。

我已经发现如何使用此线程weighted_avg_and_std中指定的函数以加权方式计算前两个时刻（均值、标准差），但我不太确定如何将其扩展到偏斜和峰度，甚至第 n 个统计时刻。

我在这里找到了定义本身，并且可以手动编写函数来从头开始实现它，但在我开始这样做之前，我想知道是否有任何现有的包或函数可以做到这一点。

谢谢

编辑：我想通了，以下代码有效（请注意，这是用于人口时刻）

和

numpy scipy skew kurtosis code-statistics

2020-04-30T10:32:58.493

0 投票

1 回答

44 浏览

python - 峰度在不同形状的正态分布上保持不变？

我想探索具有相同均值但改变标准的正态分布。

我希望峰度会随着标准的变化而变化，但在我的结果中峰度保持不变？

这里有什么问题？

起初，我通过移动标准生成了一些正态分布：

nd_l_std_44 = {} for i in range(1,10): >> nd_std_44 = stats.norm.rvs(loc=0, scale=i, size=10000, random_state=5) >> nd_l_std_44["ndl_std_{i}" .format(i=i)] = nd_std_44 打印(nd_l_std_44.keys())

这行得通，我确实得到了一个每个键都有不同值的字典。

我确实绘制了结果分布：

我预料到了这一点。峰度不同，而平均值保持不变。现在我以多种方式计算峰度，例如使用 scipy.stats

kurt_std_1 = dict() for k,v in nd_l_std_44.items(): >> kurt_std_1[k] = stats.kurtosis(v, Fisher=False) print(kurt_std_1)

问题是，对于所有发行版，我确实得到了相同的峰度。熊猫也是如此。对于具有不同标准的分布，我预计会有显着不同的峰度值。相反，这些值在很大程度上是相等的。）

{ 'ndl_std_1': -0.0690005257753592, 'ndl_std_2': -0.0690005257753592, 'ndl_std_3': -0.0690005257753592, 'ndl_std_4': -0.0690005257753592, 'ndl_std_5': -0.06900052577535831, 'ndl_std_6': -0.0690005257753592, 'ndl_std_7': -0.06900052577535876, “ndl_std_8”：-0.0690005257753592，“ndl_std_9”：-0.0690005257753592 }

这里发生了什么？非常感谢您的帮助。

python scipy normal-distribution scipy.stats kurtosis

2021-03-07T13:44:00.180

问题标签 [kurtosis]

Reference