问题标签 [significance]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
328 浏览

r - 仅比较某些组组合的均值

数据如下所示:

我想执行显着性检验来比较 rev.1 和 rev.2 的均值,仅在分组 class.1=class.2 的情况下。例如,我试图比较所有“7”类,然后比较所有 1318 个类。我尝试使用 ANOVA 和 TukeyHSD 进行此操作,但仅比较我想要的组时遇到问题。任何指导将不胜感激!

0 投票
1 回答
3811 浏览

r - ggsignif:如何在 x 轴刻度上定位显着性符号

我想在每组上绘制一个带有显着性水平(例如***)的箱线图,没有一条线。生成 p 值/显着性水平的比较将针对每个测试组相对于单个对照组。

我有很多不同的图表要制作,这意味着为每个手动创建和定位文本框将非常耗时。因此,我希望使用 geom_signif 函数来自动计算和定位这些。

我能够创建如下内容:

这对于两个或三个组来说很好,但对于大量组(例如我正在使用的数据集中)来说会变得混乱。

另一种方法:

这看起来很糟糕。但是,如果重要符号可以间隔以匹配 x 轴刻度,并且最好可以删除/隐藏线,这将是理想的。

谁能演示如何做到这一点?

0 投票
1 回答
216 浏览

r - power.prop.test 功能不可互换

我正在使用power.prop.testR 中的函数。

我正在进行 A/B 测试,我正在确定每个组的最小展示次数的提升,以使 A/B 测试显着。

当我运行如下函数时,我得到第二个比例 (p2) 为 0.0001870215,n 为每组 2,571,429:

我的回答是这样的:

当我用我对 p2 (0.0001870215) 的答案重新运行它来求解 n 时,会出现一个不同的 n (230,952.6):

我的 n 更改为:

为什么在这种情况下 n 会改变?

0 投票
1 回答
322 浏览

r - 从相关矩阵中提取特定的成对相关,并为相应的显着性水平添加适当数量的星号

我正在创建一个(apa)表,其中包含来自更大矩阵的特定相关性,如果相关性很重要,我还想添加一个星号。我使用 Hmisc 包来创建所有可能的相关性和相应的 p 值。然后我使用 MOTE 包对相关性进行四舍五入并去掉前导零。然后我将 p 值更改为星号。我提取了这些感兴趣的相关性并将它们放入一个新矩阵中。假设我只想创建一个新的相关矩阵(3 x 4),其中“am”、“gear”和“carb”定义 3 行,“mpg”、“cyl”、“disp”和“hp”定义4列。

在这之后,我被卡住了。现在我想为每个单元格添加适当数量的星号(在相关值的后面),如果可能的话,让所有东西都很好地垂直对齐。小数点垂直上方的点,也许这是我需要在 rmarkdown 中做的事情,但我还没有那么远)。当然,如果有更简单——或更优雅的方式——来完成这一切,我会全力以赴。谢谢你。

0 投票
1 回答
337 浏览

stata - 多重插补数据的 Stata 相关 P 值

我在 Stata 中运行 Pearson 对多重插补数据的相关性:

上面的代码运行良好,只是它不会为每个系数生成 p 值。

有没有办法包含 p 值?

0 投票
0 回答
42 浏览

r - 显着性检验:WinSTAT 与 R

某种奇怪的问题,但我在这个话题上找不到任何东西。在我们的统计课程中,我们使用 excel 插件 WinSTAT 来解决我们所有的问题,是的,它很容易使用,到目前为止没有任何问题。

但是,当我尝试计算例如 R 中的“Wilcoxon 符号秩检验”时,结果总是与 WinSTAT 结果不同。我不确定这是我的错误还是来自 WinSTAT。我无法想象 R 在这样的基本功能中存在错误。

我在 R 中wilcox.test(data$1960, data$2002, paired = T, exact = F)
的调用:p 值 = 0.0002876
在 WinSTAT 中,p 值为:0,000293052520203

是数据。

所以问题是我的错还是 WinSTAT 的错?

编辑:更多信息:当我比较“配对 t 检验”的结果时,一切都很好,没有任何问题。

0 投票
1 回答
642 浏览

r - Stargazer 中标准化/非标准化系数的不同意义

我已经使用对大型数据集执行了多元线性回归

使用 lm.beta 添加标准化 beta 系数

并使用 stargazer 将结果制成表格

输出给了我两列系数,但是,其中一些的显着性值是不同的,当标准化不标准化时,非标准化通常显着

这篇文章的答案:在观星表中包含标准化系数仅对常量显示相同的内容(他们不评论它),而我的许多变量都有它。

为什么会发生这种情况,它是我的代码中的错误还是在统计上有效?我看不出标准化应该如何改变重要性。

谢谢!

0 投票
0 回答
329 浏览

r - 如何解释没有显着系数的 VAR 模型?

我正在尝试调查一些谷歌趋势数据和股票价格之间的关系。

我执行了增强的 ADF 测试和 KPSS 测试,以确保两个时间序列以相同的顺序集成 ( I(1))。

但是,在我进行第一个差异之后,ACF 图完全微不足道(当然除了 1),这告诉我差异序列的行为就像白噪声。

尽管如此,我还是尝试估计一个您可以看到附加的 VAR 模型。

如您所见,只有一个常数是重要的。我已经读过,因为Stocks.ts.l1在 GoogleTrends 等式中GoogleTrends.ts.l1不重要,在 Stocks 等式中不重要,所以两个时间序列之间没有动态,并且两者也可以是具有模型的彼此独立的AR(p)模型。

我检查了模型的残差。它们满足假设(未完全给出正态分布的残差,但可以,存在同方差性,其稳定且没有自相关)。

但是,如果没有系数像Stocks.ts方程的情况那样显着,这意味着什么?模型是否不适合拟合数据,因为数据不遵循 AR 流程。还是模型太糟糕了,以至于常数会比模型更好地描述数据?还是前面几个问题的组合?有什么建议可以让我进行分析吗?

提前致谢

VAR输出(来自R)

0 投票
0 回答
323 浏览

python - 如何计算熊猫或其他python模块中相关性的统计显着性

我在 Python 中使用 Pandas 库。

因此,我正在计算数据集中属性之间的相关性。

这是一个很好的函数,它返回所有属性之间相关性的数据框。

有一个术语称为相关性的统计显着性,它测试这种差异是偶然获得的概率(此处描述)

那么有人知道是否有函数可以在 pandas 或其他 Python 库中返回它。

0 投票
1 回答
678 浏览

python - 使用 scipy.stats 和 pandas 计算相关性及其统计意义

我正在使用 Pandas 库进行一些数据分析。我正在测试属性之间的相关性。.corr()所以我使用Pandas 库的函数计算了相关性。我还想计算这种相关性的统计显着性。我已经在这里问了一个问题。Pandas 库似乎没有这个功能。

我被建议使用scipy.stats.

pearsonr是计算 pearson 相关性的函数,.corr()除了它还返回显着性之外,这正是我所追求的。

pearsonr不能处理 Na/null 值。所以我用.dropna(). 这将删除更多示例。

在我的原始 csv 文件中,NA/空值有更多的词,我在打开文件时考虑了这一点:

.corr() 处理缺失缺失值本身。问题是为什么要.dropna()删除太多的例子。有些值是 0 或 0.00(百分比),但出于我的目的,不应将其排除在外。

.csv 文件中的几行: