问题标签 [statistical-test]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在 python scipy 中实现 Kolmogorov Smirnov 测试
我有一个关于 N 个数字的数据集,我想测试它的正态性。我知道 scipy.stats 有一个kstest 函数 ,但是没有关于如何使用它以及如何解释结果的示例。这里有熟悉的人可以给我一些建议吗?
根据文档,使用 kstest 返回两个数字,KS 测试统计量 D 和 p 值。如果 p 值大于显着性水平(例如 5%),那么我们不能拒绝数据来自给定分布的假设。
当我通过从正态分布中抽取 10000 个样本并测试高斯性进行测试时:
我得到以下输出:
(0.04957880905196102, 8.9249710700788814e-22)
p 值小于 5%,这意味着我们可以拒绝数据呈正态分布的假设。但是样本是从正态分布中抽取的!
有人可以理解并向我解释这里的差异吗?
(正态性测试是否假设 mu = 0 和 sigma = 1?如果是这样,我如何测试我的数据是高斯分布但具有不同的 mu 和 sigma?)
r - 两种明显不同分布的统计检验(在 R 中)的选择
我有以下数据列表,每个数据都有 10 个样本。这些值表示特定分子的结合强度。
我想要展示的是“x”在统计上与“y”、“z”和“w”不同。如果您查看 X,它会比其他值具有更多大于零的值(2.8、1.00、5.4 等)。
我尝试了 t 检验,但所有这些都显示出高 P 值的微不足道的差异。
什么是合适的测试?
下面是我的代码:
java - 如何在 Java 中保存 R 统计测试的结果
我在我的 Java 程序上使用 R,我需要使用一些统计测试,例如 anova。
但我不知道如何将 R 结果保存在文件中以便以后在 Java 中管理它们。
我尝试将 RCaller 和 rJava 加入 R 和 Java,但我认为问题不在于加入 R 和 Java 的方式。
有人知道我能做什么吗?
例子:
我在 csv 文件中有这个数据集:
所以我在 R 中运行这些命令:
结果是这样的:
如何保存此结果以供以后管理?
java - 在 Java 中运行 Smirnov 测试
我正在尝试在 Java 中运行 Smirnov 测试,以查看两组数据是否来自同一分布。但是,我收到“找不到符号”错误。如何“构建” Smirnov 测试以免出现此错误?
normal-distribution - 整数正态分布
我在这里遇到了一些非常有趣的问题。它是关于创建一个整数在 1 到 5 (1,2,3,4,5) 范围内的正态分布。从技术上讲,它是具有正态分布形状的泊松分布。
我的问题:当我创建如上所述的分布时,正态性测试失败(p < 0.01)(Shapiro Wilk 测试,Kolomogorov Smirnov 测试),因为我创建了一个四舍五入的正态分布数字池:
xRND<-round(rnorm(179,mean=2.9,sd=1)) 表(xRND) xRND 0 1 2 3 4 5 6 2 14 41 67 45 9 1
是否有任何测试可以帮助我检查正态分布形状?
最好的问候,圣。
python-2.7 - scipy.stats.anderson 测试临界值
我曾经scipy.stats.anderson()
测试过正态分布。我的测试分布不是正态分布,因此 teststatistic > 临界值。但是,当检查我观察到的所有计算的临界值时,对于降低 p 值的临界值正在增加。这意味着,检验越关键(p 值越小),临界值越接近检验统计量。在我看来,这应该是另一种方式。任何熟悉安德森测试及其在 Scipy 中的实现的人?
r - 逻辑与生物分布的似然比检验 r
我正在尝试验证我的数据在具有逻辑联结的双变量 GEV 和双逻辑联结之间的更好估计分布。
我通过可能性比率检验进行操作,当零假设被拒绝时,它只显示一个好的 p.value。我认为这是由于代码错误。
请帮忙
数据:
代码:
输出:
输出:
r - R中内置的Tukey-HSD统计测试图形中置信区间的含义
我进行了 5x2 交叉验证实验,然后,我进行了 Tukey-HSD 成对比较,比较了 5 种技术的 10 个准确度,如下所示。
上图是在以下 R 命令之后产生的:
我想知道的是为什么该图中的一对技术仅由一个置信区间表示。
我所知道的是,一种技术可以用一个置信区间来表示。为什么在图中一个置信区间代表了几种技术?这是两个置信区间的减法吗?
r - R中的Kolmogorov-Smirnov检验
我尝试使用 Kolmogorov-Smirnov 检验来检验样本的正态性。这是我所做的一个简单的小例子:
这是 R 给我的结果:
p 值非常低,而测试应该接受零假设。
我不明白为什么它不起作用。
r - 如何在 R 中编写 Kolmogorov-Smirnov
长话短说,我想手动编写 Kolmogorov-Smirnov 单样本统计的代码,而不是在 R 中使用 ks.test()。据我了解,KS 测试基本上是分子和分母之间的比率。我有兴趣写出分子,据我了解,这是观察样本与理论假设之间的最大绝对差异。让我们以下面的案例为例:
在这里,我想获得最大绝对差(数据 - 预期)。
有人有想法吗?如有必要,我可以改写这个问题。谢谢!