问题标签 [goodness-of-fit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3149 浏览

r - 如何在 R 中正确使用 gofstat?

我正在尝试在 R 中编写一些代码,从 Excel 中获取样本数据并确定最适合数据的分布,然后是所述分布的参数。经过一番谷歌搜索,我决定尝试使用 fitdistrplus 来拟合分布,并看到 gofstat 是一个可用于检查拟合优度的函数。我想比较 GOF 统计数据以找到循环中最合适的分布。

我的代码的最初部分实际上只是从 Excel 导入我的示例数据(我在 Excel 中创建了一个 1000 个值,通常分布在 Excel 中,并将其保存为 CSV 格式的单列),并尝试将其拟合到分布和绘图结果。

但是,每当我尝试运行代码时,都会收到错误消息

gofstat(func) gofstat(func) 中的错误:参数 f 必须是“fitdist”对象或“fitdist”对象列表。for(i in 1:1000) + plot(f[[i]]) f[[i]] 中的错误:下标超出范围

尽管出现“下标越界”错误(我认为这可能是由于导入数据中的杂散负值),这些图仍然出现,但我真的想找出我的 gofstat 使用有什么问题。有任何想法吗?

PS 我的 R 经验仅限于我们在大学学习的一个模块,而且非常基础。因此,任何高级技巧都会受到赞赏。

0 投票
0 回答
786 浏览

r - 从 r 中 fitdistrplus 包中的拟合优度测试中找到 p 值

我想将分布拟合到我的数据中。我在 r 中使用 fitdistrplus 包来查找发行版。我可以比较不同分布的拟合优度结果,看看哪个更适合我的数据,但我不知道如何检查每个分布的拟合优度检验的 p 值。结果可能表明,在伽马、对数正态和指数中,指数分布对安德森 darling 检验的统计量较低,但我不知道如何检查这些检验的 pvalue 是否不拒绝原假设。R中是否有任何内置函数可以提供p值?这是我用作示例的一段代码:

此代码生成 50 个从 0 到 100 的随机数,并尝试找到最适合这些数据的模型。如果 descist(d) 表明 gamma 和指数是最佳拟合模型的两个候选者,则 fitg 和 fitg2 会找到它们的相关模型。最后一行比较了 Ks 和 anderson darling 统计数据,以显示最适合的分布。对于这些测试,具有较低值的分布是最好的。但是,在比较它们之前,我不知道如何找到 fitg 和 fitg2 的 p 值。如果 pvalues 表明这些分布中没有一个不适合这些数据,那么将它们的拟合优度统计数据与我的知识进行比较是没有意义的。

任何帮助表示赞赏。谢谢

0 投票
1 回答
299 浏览

r - R,卡方检验,2 暗随机向量,拟合优度

我有一个大小为 $n$ 的样本 $x$ 并且 $n$ 是偶数。$H_0$ 是集合 $\{1,\dots,S\}$ 上的均匀分布。基本上我这样做:

之后,我想使用卡方检验进行拟合优度,而不是独立性!更准确地说,我有一个随机变量序列 ${x_1,x_2,\ldots, x_n}$,现在我有一个随机向量序列 ${(x_1,x_2), (x_3,x_4), \ldots, (x_ {n-1}, x_n)}$ 并且我想测试 $H_0^*$ 关于集合 $\{1,\dots,S\}^2$ 上的均匀分布。

我对Rhelp中关于 chisq.test的页面有点困惑。我如何使用在上面的代码块中创建的 , 来处理卡方检验的良好拟合,而不是(!)独立性?table

是吗

我在找什么?

0 投票
2 回答
3537 浏览

r - 您如何对 R 中的广义线性模型执行链接测试的优度?

我正在为一些具有两个全因子预测变量的数据在 R 中拟合广义线性模型(使用 glm())。我相信 gamma 系列是正确的错误分布,但不确定要使用哪个链接函数,所以我想测试所有可能的链接函数。当然,我可以通过为每个链接函数制作单独的模型然后比较偏差来手动执行此操作,但我想有一个 R 函数可以执行此操作并编译结果。我已经在 CRAN、SO、Cross-validated 和 web 上进行了搜索——我发现最接近的函数是clm2,但我不相信我想要一个累积链接模型——基于我对 clm 的理解。

我当前的模型如下所示:

我如何将这个模型编码成一个 R 函数来进行这样的“链接优度”测试?

(就此类测试的统计有效性而言,此讨论以及与统计博士后的讨论使我相信比较 AIC 或广义线性模型之间的偏差是有效的,这些模型除了具有不同的链接外是相同的功能)

0 投票
1 回答
4012 浏览

r - Poisson Kolmogorov Smirnov 关系警告

我正在尝试对向量运行 KS 测试以检查它是否遵循泊松分布

不幸的是,一旦我在下一步运行 ks.test,就会收到以下消息

警告消息:在 ks.test(Data, "ppois", lambda = distFit$estimate) 中:Kolmogorov-Smirnov 测试不应存在平局

知道如何解决这个问题吗?

0 投票
2 回答
711 浏览

python - 我需要找到来自零售连锁网络的数据分布。没有分布适合数据

我需要找到来自零售连锁网络的数据分布(所有商店的产品需求)。我尝试使用 EasyFit(它有 82 个分布来检查最佳分布)来拟合分布,但没有分布适合数据。可以做什么?有什么方法可以确定数据分布是多重分布的总和还是卷积?我已经从数据集中删除了峰值、季节性或促销数据,但仍然不适合分布。

0 投票
1 回答
482 浏览

python-2.7 - pymc 中的拟合优度和绘图差异

我正在使用 PYMC 2.3.4。我觉得棒极了。现在我想在文档的第 7.3 节(https://pymc-devs.github.io/pymc/modelchecking.html)中显示的拟合和绘图差异做一些好处,在文档中他们说你需要 3差异图的输入

  1. x:数据
  2. x_sim:后验分布样本
  3. x_exp:expected value 前两个能看懂,第三个看不懂

这是代码

一切正常,然后我尝试绘制差异,但我不知道将什么作为预期值你能帮忙吗?到目前为止,我已经这样做了:

但我有错误

我能做些什么?您能否为我提供一个如何创建预期值的虚拟示例?此外,当我使用该功能时

只绘制了数组最后一个条目的图 我怎样才能为每个条目绘制一个图?

谢谢你的帮助

0 投票
1 回答
270 浏览

r - 计算条件推理树的偏差

我正在尝试使用条件推理树(通过 package partykit)作为归纳树,其目的仅仅是描述而不是预测个别情况。根据 Ritschard herethere说法,例如,可以通过交叉表比较响应变量的实际分布和估计分布与可能的基于预测变量的配置文件(所谓的^ TT和表格。我想使用偏差和其他派生统计作为 GOF 测量对象获得的对象ctree()功能。我正在向这个主题介绍自己,我非常感谢一些输入,例如一段 R 代码或关于ctree可能涉及编码的对象结构的一些方向。我认为自己可以从头开始获得目标表和预测表,然后计算偏差公式。我承认对如何进行完全没有信心。

提前非常感谢!

0 投票
1 回答
869 浏览

matlab - Matlab的多元拟合优度检验

所以我现在正在做研究,我想测试一下我的估计方法的准确性。我想对我的分布应用拟合优度测试。我希望 Matlab 有一种本地方式来做到这一点,或者也许有人已经为此编写了某种代码。

现在我的工作如下:我有一个带有n 个观察值的多元修正帕累托分布。模拟后,我将得到一个n x m矩阵,其中m是 Depended-Pareto 随机变量的数量。

我想运行这样的东西只推广到m维,或者最好是Kolmogorov-Test

到目前为止,通过我的研究,我只找到了一种使用 Copulas 的方法,但这并不是我想要的。

我可以编写自己的代码,但我希望社区已经编写和测试了一些东西。

0 投票
2 回答
5123 浏览

simulation - 纳什-萨特克利夫效率 (NSE) 的价值是多少?

在水文学中,Nash-Sutcliffe 效率 (NSE) 系数用于确定模型效率。类似于确定系数(更好地称为 R^2),其中 - 作为经验法则 - 高于 0.7 左右的所有值都被认为是合适的(或更好),NSE 的哪个值被认为是可以接受的当您建模例如放电时间序列时?