0

嗨,有一组观察结果 obs= https://drive.google.com/file/d/0B3vXKJ_zYaCJVlhqd3FJT0xtWFk/view?usp=sharing

我想证明它们来自 Gamma 分布。

为此,我:

%estimate parameters gamma distribution    
paramEsts_gamma = gamfit(obs);   
% estimate cdf gamma distribution (objects)
gamma_cdf=makedist('Gamma','a',paramEsts_gamma(1),'b',paramEsts_gamma(2));

% test with kstest if data comes from a gamma distribution
    [h_gamma_ks,p_gamma_ks,kstat_gamma_ks,cv_gamma_ks] = kstest(obs,'CDF',gamma_cdf)

% test with chi2gofif data comes from a gamma distribution
    pd_gamma = fitdist(obs,'Gamma');
    [h_gamma_chi,p_gamma_chi,st_gamma_chi] = chi2gof(obs,'CDF',pd_gamma)

我的问题是我得到了 pvalue 的 NaN p_gamma_chi.... 我在哪里犯了错误?谢谢

这里有一些代码可以直观地检查分布

%% Plot cdf
% empirical cdf
[f_emp,x_values] = ecdf(obs);
f_gamma = gamcdf(x_values,paramEsts_gamma(1),paramEsts_gamma(2));

     figure
     hold on;
     F = plot(x_values,f_emp);
     set(F,'LineWidth',2);

     G = plot(x_values,f_gamma,'r-');
     set(G,'LineWidth',2);


     legend([F G],...
        'Empirical CDF','Gamma CDF',...
        'Location','SE');
4

1 回答 1

0

正如您的代码输出所示st_gamma_chi.df = 0,这意味着 0 自由度 ( dof)。

dof = N - n - 1

其中:
N是频率数,在您的情况下N = length(st_gamma_chi.edges)-1 = 3
n是拟合参数的数量,在您的情况下n = 2

因此,您使用默认选项获得 0 dof,您可以通过增加计算频率的 bin 数量来改善此问题:

[h_gamma_chi,p_gamma_chi,st_gamma_chi] = chi2gof(obs,'CDF',pd_gamma, 'NBins', 20)

但这并不能免除您对卡方检验的理解。

于 2014-11-17T11:56:11.937 回答