问题标签 [contingency]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1581 浏览

r - 使用表格时选择数据框中最常见的元素

我有一个要在其上使用表的数据框列表。该列表如下所示:

从这个数据框列表中,我想使用 table() 提取 $words 的列联表,但还要同时选择每个单词最常见的发音。所需的结果在 ls_out 中:

如果两个或多个发音频率相同(如 ls[[2]] 中的 ði 和 ðə),则需要随机选择一个发音。

任何关于如何做到这一点的建议都非常受欢迎。

0 投票
1 回答
1253 浏览

r - 你怎么能强制在 R 的表中包含一个级别?

有没有办法强制 R 的table函数包含行或列,即使它们从未出现在数据中?例如,

返回

其中行中缺少 3,列中缺少 2,因为它们没有出现在数据中。

有没有一种简单的方法可以强制将额外的零行和列插入正确的位置,而不是返回以下内容?

0 投票
2 回答
2482 浏览

r - 根据单元格值删除列联表的行

我有一个包含大约 20,000 个观察值的数据框。由此我创建了一个列联表,其中包含两个变量的频率。

有了这个,我想对独立性进行卡方检验,看看我的两个变量之间是否存在关系。通常这很容易,但许多单元格的预期值为 0,尽管原始数据框的大小很大。我想删除频率小于 5 的所有行。

我已经广泛搜索了堆栈交换,但我找不到解决这个特定问题的解决方案,我要么a)理解(我对 R 比较陌生),要么 b)使用列联表而不是原始数据框.

非常感谢任何帮助。

编辑:

感谢您的回复贾斯汀。

根据要求,我已经上传了数据框和列联表的摘录。我还上传了到目前为止我尝试过的少量代码,并有结果。

数据框

所以有两列,第一列是三字母部门代码,第二列是一位整数 (1-7)。

列联表

所以有一个标准的带有频率的列联表。

到目前为止,我知道我可以创建一个逻辑测试来测试单元格内容是否小于 5:

我不知道的是如何使用这行代码创建的矩阵来删除整行(如果它们有任何 FALSE 条目)。

希望有帮助。恐怕我是新手,但只有一种学习方法......

0 投票
0 回答
541 浏览

hive - Hive 中的列联表/交叉表

我试图以列联表的形式获得 Hive 中几个分类变量的结果。

结果应该是这样的

其中 x - 各个值组合的计数。我的数据对于每个变量都有 3 个以上的分类值,大约 100 个。

所以,我尝试了几个步骤:

那会给我 tmp_1

和 tmp_2 类似。

现在,从 tmp_1 中
选择 Var1,collect_set(Var2_count);
从 tmp_2 中选择 Var2、collect_set(Var1_count);

对于许多分类值和超过 2 个变量,是否有更好的方法、正确的方法?

0 投票
1 回答
247 浏览

r - 获取列联表的条件子集

我有一些数据,我总结为列联表。数据中有几个条目缺失或错误值。根据下面的代码,使用 table 构建表非常有用,因为我可以通过检查有多少数据丢失或无意义。

事先知道要保留哪些数据项,如何选择数据的子集?例如,一个包含部分数据的小表是:

我只对zzZZZz条目感兴趣,所以我可以像这样提取表的相关子集:

但是,完整的数据集更复杂:

如何仅通过引用 、 和 来对表进行zzZzzZZZ?使用转换为数据框as.data.frame(my.tab)会丢失表结构,并且我似乎无法获得正确的语法(例如,我尝试过没有成功的tapply事情)。tapply(sm.neg.grp, sm.pos.grp, sum)非常感谢任何帮助!

以下是dput表格的命令:

0 投票
3 回答
118 浏览

r - 如何在不增加频率的情况下重塑 R 中的 data.table 或 data.farme?

我正在尝试将以下 data.table 重塑为列联表(不完全是因为我不想将频率作为值,我只想要 0 或 1):

自由度:

我尝试了以下两件事,但得到了相同的结果:

第一的:

第二:

我在数据中添加了 value 列,例如 Value = 1: Df:

并尝试过:

两个结果是一样的:

这里我不想要频率,我只想要它是否存在,否则值应该是 0:

任何建议都受到高度赞赏。

0 投票
1 回答
754 浏览

r - 加载和扩展列联表

我有一个代表我需要使用的列联表的数据文件。问题是我不知道如何正确加载它。

数据结构:

  • 行:个别教堂
  • 第一栏:教堂名称
  • 第 2 - 第 12 列:关注者的平均年龄
  • 每个单元格:跟随相应教堂并相应年长的人数。

//在原始数据集中,只有年龄范围可用(例如 60-69 岁之间),所以为了使用它进行计算,我决定用平均年龄替换它(例如 64.5 而不是 60-69)

数据样本:

我试图简单地加载数据并使它们成为“表”,以便我可以扩展它,但它不起作用(只产生了一些非常奇怪的东西)。

当我尝试使用这些数据来生成一个简单的图表时,它也不起作用。

分类数据集 [2,2:4] 向我展示了它是一个我不理解的“列表”(我猜这是因为数据集是 data.frame 而不是表)。

如果有人能指出我正确的方向如何正确地将数据加载为表格然后使用它们,我将永远感激:)。

0 投票
2 回答
753 浏览

r - 3路平面列联表(ftable)中的“嵌套”相对频率

我想知道是否有一种直接的方法可以在三向平面(!)列联表中获得嵌套的相对频率。

此代码产生以下输出:

我想得到的是

我知道我可以用 prop.table 计算表格,但还没有弄清楚如何将它与 ftable 生成的平面列联表结合起来。当然有一种方法可以分别计算每个性别组的相对频率,但我对更直接的方法感兴趣。到目前为止,我还没有找到任何方法如何将相对频率放入平面列联表中。

注意:在此示例中,男性和女性组具有相同的大小 (5);但是,我正在寻找的解决方案应该足够灵活,以便组也可以有不同的大小。

非常感谢!

0 投票
1 回答
1917 浏览

mysql - 在sql中构建2x2列联表

我正在尝试构建一个 2x2 列联表,如下面的链接中所述:

即席 2x2 列联表 SQL Server 2008 (试图理解代码但无法理解它)

循环构造成对,如 C1,C1 C1,C2 C2,C1 C2,C2。(笛卡尔积)

这些对作为参数提供给 sql 代码。对于这个例子,我已经给了 sql 代码一对 --> C1,C1

当为不同的对构造它时,它们是正确的,如 C1、C2、C2、C1(经过下面解释的一些修改)。当制作成对的 C1,C1 或 C2,C2 时,它会构造一个错误的列联表。

例如(表名是 alpha_occurence):

C1,C1 对的 2x2 列联表应从上表给出:

而是给出(经过一些修改):

请注意,我已将 - 用于值不是 C1,不是 C1。因为要计算使用了另一种方法。

此 sql 代码用于检索值:

检索到值后,将在这些值上运行一个小脚本以更正它们。完成以下操作:

0 投票
1 回答
2052 浏览

r - 如何输入一个三向表?

我有表格形式的数据(甚至不是 R 表),我想将其转换(或输入)到 R 中以执行分析。

该表是一个三向列联表,如下所示: 在此处输入图像描述

有没有办法轻松地将它输入到 R 中?(只要我可以进行一些回归分析,它可以采用任何格式)

还是我需要手动输入?