我正在尝试将网络累积分布的对数对数图拟合到三个模型之一: Exponential (P(k)~e^(-ak))
、 Exponentially truncated power law(P(k)~k^(a-1)e^(k/kc))
和 Power law (P(k)~k^-a)
。我知道这是一个低信息测试,但我只是想确定三个模型中哪一个最适合(或者可能是最不适合的!)
我有一个 Excel 表,其中包含logCPK
网络(B 列)和三个模型(C、D 和 E 列)的拟合值。我还计算了三个模型(G、H 和 I 列)的总平方和 (SST)(F 列),然后是误差平方和 (SSE)。
对于这三个模型中的每一个,我计算1-(sum(SSE)/sum(SST))
以估计每个模型的简单线性回归的 R^2 值,该值在 Excel 工作表底部以黄色突出显示。所以,现在我有三个 R^2 值(幂律 = 0.507,指数 = 0.777,指数截断幂律 = 0.899)。
起初,指数截断幂律似乎最适合(最高 R^2 值)。但是,我不确定如何解释指数截断幂律的自由度为 2,而其他两个模型的自由度为 1 的事实。
当我联系另一个统计在线资源时,我被告知我应该使用“似然比检验”。据我了解,最佳拟合的“对数似然”负值最小。然而,指数截断幂律的“对数似然”一开始似乎负值最小(因为它有两个 df,而其他两个模型只有一个 df),所以我必须测试它是否真的仍然存在考虑了自由度后,负值较小。
我想我知道如何在 Excel 中理论上计算其中的一部分:
1) 使用 chidist(A,B) 其中 A 是
2*(log.likelihood of Exponentially
truncated - log.likelihood of Power law)
B 是 df (2-1=1) 的差值。如果 p 值小于 0.05,则指数截断确实比幂律更适合。2) 使用 chidist(A,B) 其中 A 是
2*(log.likelihood of Exponentially
truncated - log.likelihood of Exponential)
B 是 df (2-1=1) 的差值。如果 p 值小于 0.05,则指数截断确实比指数更适合。
然后我可以得出结论,哪个模型最合适。
这就是我的问题所在(取决于我上面的想法是否正确),如何计算对数(可能性)?我已经搜索过,但仍然迷路。似乎这种手工计算是一头野兽(除非我可以简单地使用我在 Excel 中已有的东西),所以我也在询问软件。
另一种选择是计算 AIC(也向我建议),尽管我相信我仍然会遇到同样的问题,我需要计算 AIC 方程的对数(可能性)(AIC = 2k - 2ln(L))
。
所以我的具体问题是如何直接从 Excel 中的内容或使用软件计算这三个模型的 AIC 和/或 log(可能性)。
先感谢您!
PS:我研究过 R 编程,发现它有一个 AI{stats} 和 logLik{stats} 函数,但我从文档中不明白我是否有所有必要的输入信息来运行这些函数,如果有,如何运行它。