0

我正在用 Python 开发一个系统,它在给定统计曲线中所需的概率的情况下返回一个特定的数字

我的数据集包含这个变量的每个值,我称之为“数据”。首先我得到这个值并显示它的直方图

import pandas as pd
from scipy import stats
from fitter import Fitter

data = pd.read_csv("124_2.csv", encoding='ISO-8859-1',sep=';',decimal=',') 

plt.hist(data)
plt.show()

数据的帕累托分布

在直方图之后,我将其拟合到最佳曲线

dist_names = ['rayleigh', 
             'pareto',
             'exponnorm',
             'alpha',
             'loggamma',
             'lognorm',
             'laplace',
             'beta',
             'expon',
             'gamma',
             'lognorm',
             'norm',
             'pearson3',
             'triang',
             'uniform',
             'weibull_min',
             'weibull_max',
             'invweibull']

f = Fitter(data)
f.fit()
f.summary()
f.get_best(method='sumsquare_error')

数据拟合最佳曲线

来自 get_best 的参数 = {'invweibull': (2.2940157, -3.159848, 17.021271)}

现在我得到了关于特定曲线的所有参数(在本例中为 invweibull)我现在需要的是给出一个概率数(例如 95%),系统会检索我它所代表的数字。在这个例子中,50.35

95%概率的个数是50.35

给定概率,我怎样才能得到这个数字?

4

1 回答 1

0

这是dist.ppf(0.95, *fit_result).

于 2020-05-13T04:56:18.323 回答