问题标签 [contingency]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
4269 浏览

r - 使用 R 创建大型多列频率表

我很难有效地做到这一点,如果这是一个基本问题,我深表歉意。我需要制作一个包含 N 和百分比的列联表来总结大量二元变量之间的关系,仅根据频率和百分比,没有其他汇总统计信息。

具体来说,它是总结具有样本类型 X 和临床结果 Y 的患者数量。一个患者可以有任意数量的结果和任意数量的样本,即每个变量是非互斥且独立的。

我想将所有结果(死亡、ICU 入院、腿脱落...)作为列,并将所有样本类型(血清、尿液等...)作为行。我只需要列出“阳性”反应的频率和百分比,即 N 和死亡和有尿样的患者的百分比。

有没有可以帮助这种桌子的软件包?我发现的所有东西都适合做一个漂亮的 1xN 变量列联表。如果我能以某种方式提取该输出的一列并将它们绑定到一个主表中以统治它们,我不介意为每个结果制作一个单独的表。另一个想法是以某种方式制作两个 mChoice(Hmisc 包)变量的频率表。我不知道这两种策略是否可行。

有任何想法吗?

我正在寻找的是这样的:

编辑以包含示例数据:

0 投票
3 回答
182 浏览

r - 统计权变R

我有两个向量,它们是 TRUE 或 FALSE。基本上是关于家庭的数据,以及他们是否拥有汽车以及是否有金表。(注意,“汽车”和“金表”不是实际的类别,但它们是这个问题的有效替代品)。

我想找出汽车所有权和手表所有权之间的关系,并且可以就使用哪些功能对统计数据和 R 提出一些建议。

这个想法是能够说:“如果有人有车,我们可以有 95% 的信心说他们有 25% 的机会拥有金表”

我一直在搞乱 Cross.Table 和 assocscats 并且基本上让自己对我认为的标准统计问题完全感到困惑。

关于应该使用哪些测试/功能的任何快速见解?我的相关性为 0.265,但想量化置信度。

我环顾四周,包括: 如何获得应急表? R中缺少拟合值的逻辑回归列联表

谢谢!!

0 投票
1 回答
1428 浏览

spss - 在SPSS中输入列联表

我有一个表格的列联表:

我无法将这些数据导入 SPSS v21,因此我可以对其进行分析(卡方)。我试过直接输入这样的数据并使用分析>描述性统计>交叉表,但分析结果不正确,将它们分成奇怪的类别并给我一个卡方值2。当我手动进行计算时我得到 144.2。如果有人对如何正确输入这个有意见,我将不胜感激。谢谢!

0 投票
1 回答
628 浏览

r - 规范化列联表

假设我有一张桌子

我想合并条目"www.a.com""a.com"获得

我有

问题是,如何将tab值转换为我需要的值?

0 投票
3 回答
499 浏览

r - 如何对可能包含 R 中部分不同类别的表的计数求和?

如何合并(添加)列联表:

我要这个:

0 投票
1 回答
177 浏览

r - 在 R 中从平面的 5 列 data.frame 中设置 4-D 列联表,具有 3 个因素

我在R中有一个数据框。前两列是“是”和“否”的总和频率。最后 3 列是分类因子,每列都有一个标签。

我正在尝试用这种格式制作一个 4-D 列联表,但我不知道从哪里开始这个过程。

我的数据如下所示:

我从 8 列开始:3 个类别 + 每个类别的 3 个值 + (1) 写入的报价数量,以及 (1) 这些报价的销售数量 = 8。我将各自的类别和值字符串连接起来形成上面的三列. 我有 19 个类别,每个类别都有自己的属性数量,介于 2 和 6 之间。排序会将各个列按顺序排列,但不一定形成 3 个类别的每个组合的 4-D 框和相应的 Yes (Sold) 和没有(未售出)。平均销售率为 11.4%,我想确定频率,以便对这些四向意外事件进行 Chi2 测试,以确定从均值中产生最强异常值的组合。我有 80046 种组合,基本上(19 种选择 3),这三种选择中的每一种都有各自的桶,

我不确定如何将这些数据转换为一种格式以开始使用table()andxtabs()函数,从而使用chi2.test. (我应该回到连接类别和值之前的步骤吗?)

我是 R 新手,但我知道它应该更擅长为这些大型数组编程。我无法访问 SPSS,但如果有更容易尝试的东西,我可以访问 SAS(也是新的)...

任何方向都是很大的帮助。

------------------- 想要的输出?回复 --------- 好吧,该table命令需要一个 data.frame 来自

...变成列联表格式,对吗?但是我已经有了频率格式的“是”和“否”,其中列出了三个类别。

我是否需要更改为这种单实例格式并将我的 80046 行表分解为数百万行?table或者有没有办法使用已经在两列中列出的 Yes 和 No 的频率来启动命令?

0 投票
0 回答
674 浏览

r - 列联表加置信区间

我最近发现了 deducer 及其列联表函数(请参阅Exporting deducer 的列联表为 csv 或 xls

我想要做的是在 ggplot 中绘制列联表中的值,以显示一个条形图,其中 y 轴上的频率百分比和 x 轴上的分类数据。然后,如果可能的话,我想生成误差线来显示每个变量在整体中所占比例的置信区间。

对于使用mtcars数据的示例,R 使用以下contingency.tables函数生成:

基本上是根据行总数和列总数计算的具有 x 齿轮和 y 气缸的汽车的比例。

有没有人没有办法使用 ddply 或类似方法来产生这个并添加这些比例的标准错误/置信区间?我真的很挣扎,非常感谢生命线!

0 投票
1 回答
315 浏览

r - R中的多行列联表

让我们考虑这个数据集:

在医学手稿中,第一个表格总结了人群(或其适当的亚组);这里的行是年龄、性别、吸烟状况等,两个结果将列在不同的列中。连续变量报告为平均值;分类变量作为计数。

  1. 我想知道是否有一个我缺少的函数可以创建这样的列联表。我可以手动执行此操作,但希望能够在数据集更改时自动更新。最终我需要在乳胶中输出。
  2. 该函数需要忽略丢失的数据,但不删除这些行。

问太多了?!

0 投票
0 回答
522 浏览

r - Fisher 检验超过两组基因

我正在使用 Fisher 精确检验使用 3 个或更多基因来分析对突变基因的依赖性是否增加或减少。我成功地使用 . 对两个基因进行了分析fisher.test()。2x2 列联表的示例:

现在我想知道如何对 3 个基因进行分析(并构建列联表),如下所示:基因 A 突变,基因 A 正常,基因 B 突变,基因 B 正常,基因 C 突变和基因 C 正常。

如何fisher.test()使用此数据(3x3 列联表)使用函数执行费希尔测试?

0 投票
2 回答
229 浏览

r - 列联表

我有一个包含以下数据的表:

我想为 A vs B 和 C vs D 的所有行对计算 chisq.test()。这对我来说听起来很模棱两可,所以这里有一个具体的例子:

...对所有 E、F、G、H、I 和 J 对重复

使用 chisq.tests() 计算每个表的 P 值。

我已经这样做了,但是它的输出格式很烦人。基本上我曾经combn(rownames(ex),2)得到这些对,然后写了一个经过组合结果的 lapply,从表中构造了矩阵,然后给了我矩阵的 chisq。

结果如下所示:

这工作正常,但感觉应该容易得多。之后我必须对表格进行大量重新格式化才能将其变成漂亮的表格。理想的格式是两张三角表,一张用于 A-vs-B,另一张用于 C-vs-D。

有没有做这种事情的内置函数?

希望我的问题不是太含糊,干杯。