“significance”的相关标签问题

0 投票

2 回答

328 浏览

r - 仅比较某些组组合的均值

数据如下所示：

我想执行显着性检验来比较 rev.1 和 rev.2 的均值，仅在分组 class.1=class.2 的情况下。例如，我试图比较所有“7”类，然后比较所有 1318 个类。我尝试使用 ANOVA 和 TukeyHSD 进行此操作，但仅比较我想要的组时遇到问题。任何指导将不胜感激！

2017-12-28T13:48:57.767

0 投票

1 回答

3811 浏览

r - ggsignif：如何在 x 轴刻度上定位显着性符号

我想在每组上绘制一个带有显着性水平（例如***）的箱线图，没有一条线。生成 p 值/显着性水平的比较将针对每个测试组相对于单个对照组。

我有很多不同的图表要制作，这意味着为每个手动创建和定位文本框将非常耗时。因此，我希望使用 geom_signif 函数来自动计算和定位这些。

我能够创建如下内容：

这对于两个或三个组来说很好，但对于大量组（例如我正在使用的数据集中）来说会变得混乱。

另一种方法：

这看起来很糟糕。但是，如果重要符号可以间隔以匹配 x 轴刻度，并且最好可以删除/隐藏线，这将是理想的。

谁能演示如何做到这一点？

r ggplot2 boxplot significance

2018-01-03T16:41:10.367

0 投票

1 回答

216 浏览

r - power.prop.test 功能不可互换

我正在使用power.prop.testR 中的函数。

我正在进行 A/B 测试，我正在确定每个组的最小展示次数的提升，以使 A/B 测试显着。

当我运行如下函数时，我得到第二个比例 (p2) 为 0.0001870215，n 为每组 2,571,429：

我的回答是这样的：

当我用我对 p2 (0.0001870215) 的答案重新运行它来求解 n 时，会出现一个不同的 n (230,952.6)：

我的 n 更改为：

为什么在这种情况下 n 会改变？

r statistics ab-testing significance abtest

2018-02-21T17:52:19.360

0 投票

1 回答

322 浏览

r - 从相关矩阵中提取特定的成对相关，并为相应的显着性水平添加适当数量的星号

我正在创建一个（apa）表，其中包含来自更大矩阵的特定相关性，如果相关性很重要，我还想添加一个星号。我使用 Hmisc 包来创建所有可能的相关性和相应的 p 值。然后我使用 MOTE 包对相关性进行四舍五入并去掉前导零。然后我将 p 值更改为星号。我提取了这些感兴趣的相关性并将它们放入一个新矩阵中。假设我只想创建一个新的相关矩阵（3 x 4），其中“am”、“gear”和“carb”定义 3 行，“mpg”、“cyl”、“disp”和“hp”定义4列。

在这之后，我被卡住了。现在我想为每个单元格添加适当数量的星号（在相关值的后面），如果可能的话，让所有东西都很好地垂直对齐。小数点垂直上方的点，也许这是我需要在 rmarkdown 中做的事情，但我还没有那么远）。当然，如果有更简单——或更优雅的方式——来完成这一切，我会全力以赴。谢谢你。

r matrix correlation p-value significance

2018-03-04T19:56:48.390

0 投票

1 回答

337 浏览

stata - 多重插补数据的 Stata 相关 P 值

我在 Stata 中运行 Pearson 对多重插补数据的相关性：

上面的代码运行良好，只是它不会为每个系数生成 p 值。

有没有办法包含 p 值？

stata correlation p-value imputation significance

2018-04-29T16:28:01.163

0 投票

0 回答

42 浏览

r - 显着性检验：WinSTAT 与 R

某种奇怪的问题，但我在这个话题上找不到任何东西。在我们的统计课程中，我们使用 excel 插件 WinSTAT 来解决我们所有的问题，是的，它很容易使用，到目前为止没有任何问题。

但是，当我尝试计算例如 R 中的“Wilcoxon 符号秩检验”时，结果总是与 WinSTAT 结果不同。我不确定这是我的错误还是来自 WinSTAT。我无法想象 R 在这样的基本功能中存在错误。

我在 R 中wilcox.test(data$1960, data$2002, paired = T, exact = F)
的调用：p 值 = 0.0002876
在 WinSTAT 中，p 值为：0,000293052520203

这是数据。

所以问题是我的错还是 WinSTAT 的错？

编辑：更多信息：当我比较“配对 t 检验”的结果时，一切都很好，没有任何问题。

r significance

2018-05-28T20:15:19.280

0 投票

1 回答

642 浏览

r - Stargazer 中标准化/非标准化系数的不同意义

我已经使用对大型数据集执行了多元线性回归

使用 lm.beta 添加标准化 beta 系数

并使用 stargazer 将结果制成表格

输出给了我两列系数，但是，其中一些的显着性值是不同的，当标准化不标准化时，非标准化通常显着

这篇文章的答案：在观星表中包含标准化系数仅对常量显示相同的内容（他们不评论它），而我的许多变量都有它。

为什么会发生这种情况，它是我的代码中的错误还是在统计上有效？我看不出标准化应该如何改变重要性。

谢谢！

r linear-regression stargazer significance standardized

2018-07-11T10:11:20.800

0 投票

0 回答

329 浏览

r - 如何解释没有显着系数的 VAR 模型？

我正在尝试调查一些谷歌趋势数据和股票价格之间的关系。

我执行了增强的 ADF 测试和 KPSS 测试，以确保两个时间序列以相同的顺序集成 ( I(1))。

但是，在我进行第一个差异之后，ACF 图完全微不足道（当然除了 1），这告诉我差异序列的行为就像白噪声。

尽管如此，我还是尝试估计一个您可以看到附加的 VAR 模型。

如您所见，只有一个常数是重要的。我已经读过，因为Stocks.ts.l1在 GoogleTrends 等式中GoogleTrends.ts.l1不重要，在 Stocks 等式中不重要，所以两个时间序列之间没有动态，并且两者也可以是具有模型的彼此独立的AR(p)模型。

我检查了模型的残差。它们满足假设（未完全给出正态分布的残差，但可以，存在同方差性，其稳定且没有自相关）。

但是，如果没有系数像Stocks.ts方程的情况那样显着，这意味着什么？模型是否不适合拟合数据，因为数据不遵循 AR 流程。还是模型太糟糕了，以至于常数会比模型更好地描述数据？还是前面几个问题的组合？有什么建议可以让我进行分析吗？

提前致谢

VAR输出（来自R）

r var coefficients significance interpretation

2018-07-16T19:57:10.713

0 投票

0 回答

323 浏览

python - 如何计算熊猫或其他python模块中相关性的统计显着性

我在 Python 中使用 Pandas 库。

因此，我正在计算数据集中属性之间的相关性。

这是一个很好的函数，它返回所有属性之间相关性的数据框。

有一个术语称为相关性的统计显着性，它测试这种差异是偶然获得的概率（此处描述）。

那么有人知道是否有函数可以在 pandas 或其他 Python 库中返回它。

python pandas correlation significance

2018-07-28T07:28:23.473

0 投票

1 回答

678 浏览

python - 使用 scipy.stats 和 pandas 计算相关性及其统计意义

我正在使用 Pandas 库进行一些数据分析。我正在测试属性之间的相关性。.corr()所以我使用Pandas 库的函数计算了相关性。我还想计算这种相关性的统计显着性。我已经在这里问了一个问题。Pandas 库似乎没有这个功能。

我被建议使用scipy.stats.

pearsonr是计算 pearson 相关性的函数，.corr()除了它还返回显着性之外，这正是我所追求的。

pearsonr不能处理 Na/null 值。所以我用.dropna(). 这将删除更多示例。

在我的原始 csv 文件中，NA/空值有更多的词，我在打开文件时考虑了这一点：

.corr() 处理缺失缺失值本身。问题是为什么要.dropna()删除太多的例子。有些值是 0 或 0.00（百分比），但出于我的目的，不应将其排除在外。

.csv 文件中的几行：

python pandas scipy correlation significance

2018-07-30T15:03:23.050

问题标签 [significance]

Reference