问题标签 [significance]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3853 浏览

r - R中的显着性检验

我正在尝试确定两个接口之间是否存在显着差异。我有一个如下所示的文本文件:

现在我需要找出在执行此操作时应该使用哪种方法。到目前为止,我已经尝试了韦尔奇的两个样本 T 检验方法,我认为这是正确的。但这是确定是否存在意义的正确方法吗?顺便说一句,显着性水平为 5%。

这是我的代码:

p 值的输出是:0.2586,大于0.05,这应该意味着没有意义,对吧?还是我做错了什么?我是R的初学者。

0 投票
0 回答
133 浏览

r - 在 R 中计算 Pearson 相关性和显着性

我正在尝试检查两个变量的关联,即出版物数量和出版年限。我的数据框如下所示:

我使用cor()了如下函数但没有得到结果:

关于如何解决这个问题的任何建议?

0 投票
1 回答
712 浏览

python - 是否可以在 Python 中使用 seaborn 条形图来测试重要性?

我有一个pandas.DataFrame看起来像这样的:

seaborn这个数据可以用and很好地绘制matplotlib(假设上面的数据被分配给一个名为 的变量normed

这是输出:

在此处输入图像描述

但是,我真正想做的是执行 t 检验来测试组之间的统计显着性(理想情况下,所有 n 选择 2 个变量组合,但现在让我们在第一个和第二个时间点的阴性对照之间说) . 有人知道是否seaborn支持这一点或知道对此数据执行 t 检验的另一种方法吗?此外,我已经看到seaborn支持自举统计,如果我能获得 t 检验的置信区间,那就太好了,尽管这确实是外围的。

谢谢您的帮助

0 投票
1 回答
283 浏览

r - 查找均值比率的均值的 P 值(在 R、Prism、Excel 中,其他任何免费的)

我的统计学知识很少(生物学家,我知道这不是一个好的借口),并希望在此分析中获得一些帮助。我正在测量小鼠的肌肉纤维面积,其中一块肌肉受损(D),另一块肌肉未受损(U);这样做是为了控制小鼠以及用药物治疗的一组。我希望评估这种药物是否会影响肌肉再生,使用纤维大小作为它们愈合程度的代表。每块肌肉大约有 100 根纤维,但数量不等,每只小鼠有 1 条 D 和 1 条 U 肌,每次处理有 3 只小鼠。

最初我只是简单地汇集所有纤维直径并使用 ANOVA(如 control-D、control-U、drug-D 和 drug-U),但我注意到小鼠之间的值差异很大,无论它们是否有药物与否。我希望取而代之的是每只小鼠的平均 D 与平均 U 肌肉的比率,并将种群与 t 检验进行比较;这听起来会更好地代表这个问题。但是我不知道要进行测试 - 我有标准偏差来找到每块肌肉的平均值,但是当我计算受损与未受损的比率时会发生什么?我如何确定药物是否对这些比率有显着影响?

如果有人可以向我指出更多信息,或者推荐一种更好的方法来解决这个问题,那就太好了!

0 投票
1 回答
41 浏览

excel - 过滤介于 -1 和 1 之间的值 excel

我有一个 excel 列,其中包含一些有趣的数据,但是很多正负值都是微不足道的。

所以我想把所有的值 -1<0<1 变成零。最好的方法是什么?

任何帮助都会让我开心。

0 投票
0 回答
1576 浏览

r - 使用马氏距离确定组间差异的 Hotelling 的 T^2 测试示例

我正在尝试按照出版物中描述的程序来确定组之间的分离是否具有统计学意义。该出版物的水平高于我的知识水平,但我正在尝试逐步接近它。

为了澄清和简单起见,以鸢尾花数据集为例,并在 R 中进行分析。正如 PCA 图所示,该方法应该使我能够确定组/物种之间的距离是否显着不同。
Iris Species PCA 图

据我了解,要获得此结果,该过程包括以下四个步骤:

  1. 距离计算:使用来自前两个主成分的组质心之间的马氏距离。
  2. 学生 t 检验:采用 Hotelling 的双样本 T^2 统计量来确定是否分离 btw。聚类具有统计学意义。
  3. 计算 F 统计量:将 T^2 统计量转换为 F 值并计算 F 检验以指示集群之间是否存在分离。
  4. 使用 F 统计量执行假设检验:如果 F 值大于临界 F 值,则可以拒绝假设组之间没有分离的原假设。

我被困在第一步和第二步之间。如何使用 Mahalanobis 距离计算的结果进行 Hotelling 的 T^2 检验。

MWE如下:

马氏距离计算返回三个距离

就比例而言,它们似乎与 PCA 图所示的相当。对前两个主成分的Hotelling T2 检验对所有三个比较都返回显着结果。但我想知道如何使用参考出版物中所述的先前马氏距离计算进行 T 检验?

0 投票
1 回答
166 浏览

r - 在 R 中使用正确的统计分析来确定两组比率的显着性?

我制作了一些示例数据和示例图表来显示我需要做什么。

然后我融合了数据,以便能够使用 reshape 包绘制它。

然后数据看起来像这样......

然后我使用 ggplot2 绘制它。图表看起来像这样。图形

然后我需要做的是确定这些比率之间差异的统计显着性。显然,在我的实际数据中,比率来自某个地方,但这里只是百分比,以简化问题,因此在这个特定示例中没有任何意义。

用于确定这些比率之间的差异是否具有统计显着性的正确统计分析是什么,以及如何在 R 中实现这一点?基本上,标签 A 中的 75%/25% 与标签 B 中的 60%/40% 是否具有统计学意义?

我不知道这是否是问这个问题的正确地方。谢谢!

0 投票
1 回答
11131 浏览

testing - 两个时间序列数据之间的统计显着差异

我有两组时间序列数据(series1 和 series2)。每个数据集有 20 个样本,用于 20 个时间间隔(每个时间间隔一个样本)。我想看看这两个数据集是否有显着不同。我应该使用什么测试?更准确地说,我试图预测 20 个时间间隔的人口数量。我使用了两种不同的方法来做出这个预测,这就是为什么我有两组数据。我想看看哪个预测更好更准确。我也有真实的人口数量来评估我的预测。我已经计算了RMSE这两个系列的预测。series2的均值RMSE小于 series1,但我不确定是否足以证明 series2 比 series1 的预测更好。

0 投票
1 回答
727 浏览

python - 比较两个多列数据框的统计显着性

我有 2 个数据框。每个数据框包含 64 列,每列包含 256 个值。我需要比较这两个数据框的统计意义。

我只知道统计学的基础知识。我所做的是为每个数据帧的所有列计算 p 值。然后我将第一个数据帧的每一列的 p 值与第二个数据帧的每一列的 p 值进行比较。EX:第一个数据帧的第一列的 p 值到第二个数据帧的第一列的 p 值。

然后我告诉哪些列在 2 个数据帧中显着不同。

有没有更好的方法来做到这一点。我用蟒蛇。

0 投票
2 回答
237 浏览

r - geom_path 的问题表明条形图中的统计显着差异

我想制作一个类似于此处的图表的图表指示条形图中的统计显着差异

考虑以下示例库(ggplot2)

我用一些误差线制作了一个条形图,效果很好。

好的,现在我想添加一些带有 p 值的注释,这也可以正常工作。

在此处输入图像描述

好吧,但现在我想在条形图中添加一条表示统计显着差异的线。

现在我没有工作。那么geom_path有什么问题呢?我试图用 x 改变映射。

仍然没有工作。我可以做些什么来使 geom_path 工作?