问题标签 [contingency]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
4015 浏览

r - 如何将数据框转换为R中的列联表?

我有一个简单的问题。如何将数据框转换为 Fisher 精确检验的列联表?

我有data大约 19000 行:

我想将每一行转换为列联表以执行 Fisher 精确检验。例如,对于GMNN

由于我有 19000 行数据,我希望输出为:

我不知道如何做到这一点。有人可以帮忙吗?谢谢!

0 投票
2 回答
2640 浏览

r - 交叉表输出到 R 中的 excel

在生成列联表时,我使用CrossTableR 中的函数,因为它是我设法找到的信息量最大且最灵活的函数,它可以立即为您提供很多东西,而无需单独计算。但是,它生成的输出是文本输出,主要针对 R 中的控制台。这对我来说是一个大问题,因为我依靠输出这些类型的表格来在下一步分析中表现出色。

有没有办法将输出CrossTable输出到 Excel 电子表格,以便每个数字都在自己的单元格中?(即,不是完全进入单个单元格的文本)(“文本到列”没有帮助)

0 投票
3 回答
1104 浏览

r - 将 R 中的列联表与第一列作为字符相加

我的销售数据集包括 3 列:国家、销售类型/方法、季度总收入。这是前几行的显示,以便更好地了解:

这是此数据的输出:

我正在 R 中创建一个列联表,显示每个国家/地区每种销售方法产生的季度收入。最终输出应与此类似:

reshape 库中的 cast() 函数完成了大部分工作,只留下汇总列和行以供计算所有值。

将这些行汇总到一个名为“TOTAL.cn”的新列中非常简单:

但是对列求和是一件很头疼的事情,因为最后一行的第一个组件必须是一个因子或字符。我将第一列“Retailer.country”转换为字符类型,因为它实际上只是一个视觉标签。

在对几个函数大惊小怪之后,这是我能够创建以实现预期的行求和的最佳代码:

它可以在所有列之间工作并维护正确的数据类型......但我认为必须有一种更有效的方法,也许是通过使用 apply 系列函数,来自 dplyr 等。也许唯一的方法是编写我自己的功能?

例如,未来的数据集可能有 50 多种不同的销售方法。在为“按顺序汇总”行(上图)创建列表时,我必须调用向量中的每个单元格,用逗号分隔,以便成功地将其添加到我现有的表中。其他努力将所有其他列的数据类型转换为字符,这把一切都搞砸了。

我不介意复制/粘贴“total.by.ordertype”8 次。但是当我处理 50-100 个订单类型时会发生什么?有没有更清洁的方法来重现这些?

谢谢!

0 投票
1 回答
4082 浏览

r - Rmarkdown中的两路频率表

在 Rmarkdown 中,我可以通过什么方式构建一个双向频率表?就像是:

这个

我尝试使用 knitr 包中的 kable 函数和 DT 包中的 datable 函数,但没有一个给我想要的结果。

更新:带有示例的可重现代码。

我希望 'vertical_title' 和 'horizo​​ntal_title' 在 Rmarkdown 中对我的表可见。

0 投票
2 回答
227 浏览

r - 在不更改表类的情况下对列联表进行排序

我想重新排序 cont.table 的因素

我希望能够对因子 0 和 1 进行排序。我想要的结果是这样

我是这样做的,但是我丢失了我需要的类表

有没有可能的方法?越简单越好

0 投票
1 回答
1730 浏览

python - Python:Chi 2 测试产生错误结果 (chi2_contingency)

我正在尝试使用列联表计算 python 中的卡方值。这是一个例子。

预期值为:

如果我手动计算卡方值,我得到 10。但是使用 python 我得到 9.506。我使用以下代码:

奇怪的是,该函数给了我正确的期望值,但是卡方和 p 值是关闭的。我在这里做错了什么?

谢谢

ps

我知道我在 pandas 中创建初始表非常蹩脚,但我不是如何在 pandas 中创建这些嵌套表的专家。

0 投票
3 回答
6884 浏览

python - 获取 Pandas 交叉表中的每个元素

我有一个数据集如下:

我用熊猫创建了交叉表:

我的交叉表作为输出给出:

对于给定的每个 a、b 和 c 值,我想遍历这个交叉表。我怎样才能获得诸如cross_tab[a=1][b=1, c=1]?谢谢你。

0 投票
0 回答
683 浏览

python - 从python pandas中的所有数据创建列联表

我的数据有 45222 个样本和 13 个特征。我想从所有数据创建一个列联表。

它抛出一个错误TypeError: crosstab() missing 1 required positional argument: 'columns'。你知道它的任何解决方案。

0 投票
1 回答
1148 浏览

r - 从 gplots 包为气球图创建注释

我想知道是否可以更改 gplots 包生成的气球图的行和列注释。

假设我的数据是 mtcars 数据集的子集

我可以制作气球图如下

我可以用任意颜色更改灰色条的颜色(对于 x 和 y)吗?例如,我想要红色的 mpg、cyl、disp 和 drat,其他的都是蓝色。

这可能吗?或者我需要看另一个包?

谢谢

0 投票
2 回答
285 浏览

r - 建立应急表

我有一张这样的桌子:

变成

在这里,AB是对 的变量进行分组P1, P2, P3, P4

我想为Ids( G1, G2...), Group( A, B) 和Var( -2,-1,0,1,2) 表建立一个应急方案,例如:

有没有办法在不使用大量循环的情况下在 R 中做到这一点?