问题标签 [significance]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 仅比较某些组组合的均值
数据如下所示:
我想执行显着性检验来比较 rev.1 和 rev.2 的均值,仅在分组 class.1=class.2 的情况下。例如,我试图比较所有“7”类,然后比较所有 1318 个类。我尝试使用 ANOVA 和 TukeyHSD 进行此操作,但仅比较我想要的组时遇到问题。任何指导将不胜感激!
r - ggsignif:如何在 x 轴刻度上定位显着性符号
我想在每组上绘制一个带有显着性水平(例如***)的箱线图,没有一条线。生成 p 值/显着性水平的比较将针对每个测试组相对于单个对照组。
我有很多不同的图表要制作,这意味着为每个手动创建和定位文本框将非常耗时。因此,我希望使用 geom_signif 函数来自动计算和定位这些。
我能够创建如下内容:
这对于两个或三个组来说很好,但对于大量组(例如我正在使用的数据集中)来说会变得混乱。
另一种方法:
这看起来很糟糕。但是,如果重要符号可以间隔以匹配 x 轴刻度,并且最好可以删除/隐藏线,这将是理想的。
谁能演示如何做到这一点?
r - power.prop.test 功能不可互换
我正在使用power.prop.test
R 中的函数。
我正在进行 A/B 测试,我正在确定每个组的最小展示次数的提升,以使 A/B 测试显着。
当我运行如下函数时,我得到第二个比例 (p2) 为 0.0001870215,n 为每组 2,571,429:
我的回答是这样的:
当我用我对 p2 (0.0001870215) 的答案重新运行它来求解 n 时,会出现一个不同的 n (230,952.6):
我的 n 更改为:
为什么在这种情况下 n 会改变?
r - 从相关矩阵中提取特定的成对相关,并为相应的显着性水平添加适当数量的星号
我正在创建一个(apa)表,其中包含来自更大矩阵的特定相关性,如果相关性很重要,我还想添加一个星号。我使用 Hmisc 包来创建所有可能的相关性和相应的 p 值。然后我使用 MOTE 包对相关性进行四舍五入并去掉前导零。然后我将 p 值更改为星号。我提取了这些感兴趣的相关性并将它们放入一个新矩阵中。假设我只想创建一个新的相关矩阵(3 x 4),其中“am”、“gear”和“carb”定义 3 行,“mpg”、“cyl”、“disp”和“hp”定义4列。
在这之后,我被卡住了。现在我想为每个单元格添加适当数量的星号(在相关值的后面),如果可能的话,让所有东西都很好地垂直对齐。小数点垂直上方的点,也许这是我需要在 rmarkdown 中做的事情,但我还没有那么远)。当然,如果有更简单——或更优雅的方式——来完成这一切,我会全力以赴。谢谢你。
stata - 多重插补数据的 Stata 相关 P 值
我在 Stata 中运行 Pearson 对多重插补数据的相关性:
上面的代码运行良好,只是它不会为每个系数生成 p 值。
有没有办法包含 p 值?
r - 显着性检验:WinSTAT 与 R
某种奇怪的问题,但我在这个话题上找不到任何东西。在我们的统计课程中,我们使用 excel 插件 WinSTAT 来解决我们所有的问题,是的,它很容易使用,到目前为止没有任何问题。
但是,当我尝试计算例如 R 中的“Wilcoxon 符号秩检验”时,结果总是与 WinSTAT 结果不同。我不确定这是我的错误还是来自 WinSTAT。我无法想象 R 在这样的基本功能中存在错误。
我在 R 中wilcox.test(data$1960, data$2002, paired = T, exact = F)
的调用:p 值 = 0.0002876
在 WinSTAT 中,p 值为:0,000293052520203
这是数据。
所以问题是我的错还是 WinSTAT 的错?
编辑:更多信息:当我比较“配对 t 检验”的结果时,一切都很好,没有任何问题。
r - Stargazer 中标准化/非标准化系数的不同意义
我已经使用对大型数据集执行了多元线性回归
使用 lm.beta 添加标准化 beta 系数
并使用 stargazer 将结果制成表格
输出给了我两列系数,但是,其中一些的显着性值是不同的,当标准化不标准化时,非标准化通常显着
这篇文章的答案:在观星表中包含标准化系数仅对常量显示相同的内容(他们不评论它),而我的许多变量都有它。
为什么会发生这种情况,它是我的代码中的错误还是在统计上有效?我看不出标准化应该如何改变重要性。
谢谢!
r - 如何解释没有显着系数的 VAR 模型?
我正在尝试调查一些谷歌趋势数据和股票价格之间的关系。
我执行了增强的 ADF 测试和 KPSS 测试,以确保两个时间序列以相同的顺序集成 ( I(1)
)。
但是,在我进行第一个差异之后,ACF 图完全微不足道(当然除了 1),这告诉我差异序列的行为就像白噪声。
尽管如此,我还是尝试估计一个您可以看到附加的 VAR 模型。
如您所见,只有一个常数是重要的。我已经读过,因为Stocks.ts.l1
在 GoogleTrends 等式中GoogleTrends.ts.l1
不重要,在 Stocks 等式中不重要,所以两个时间序列之间没有动态,并且两者也可以是具有模型的彼此独立的AR(p)
模型。
我检查了模型的残差。它们满足假设(未完全给出正态分布的残差,但可以,存在同方差性,其稳定且没有自相关)。
但是,如果没有系数像Stocks.ts
方程的情况那样显着,这意味着什么?模型是否不适合拟合数据,因为数据不遵循 AR 流程。还是模型太糟糕了,以至于常数会比模型更好地描述数据?还是前面几个问题的组合?有什么建议可以让我进行分析吗?
提前致谢
python - 如何计算熊猫或其他python模块中相关性的统计显着性
我在 Python 中使用 Pandas 库。
因此,我正在计算数据集中属性之间的相关性。
这是一个很好的函数,它返回所有属性之间相关性的数据框。
有一个术语称为相关性的统计显着性,它测试这种差异是偶然获得的概率(此处描述)。
那么有人知道是否有函数可以在 pandas 或其他 Python 库中返回它。
python - 使用 scipy.stats 和 pandas 计算相关性及其统计意义
我正在使用 Pandas 库进行一些数据分析。我正在测试属性之间的相关性。.corr()
所以我使用Pandas 库的函数计算了相关性。我还想计算这种相关性的统计显着性。我已经在这里问了一个问题。Pandas 库似乎没有这个功能。
我被建议使用scipy.stats
.
pearsonr
是计算 pearson 相关性的函数,.corr()
除了它还返回显着性之外,这正是我所追求的。
pearsonr
不能处理 Na/null 值。所以我用.dropna()
. 这将删除更多示例。
在我的原始 csv 文件中,NA/空值有更多的词,我在打开文件时考虑了这一点:
.corr() 处理缺失缺失值本身。问题是为什么要.dropna()
删除太多的例子。有些值是 0 或 0.00(百分比),但出于我的目的,不应将其排除在外。
.csv 文件中的几行: