“frequency-table”的相关标签问题

0 投票

1 回答

122 浏览

r - 如何从一个数据集中获取 R 中的频率表，使用间隔和中断形成不同的数据集？

我试图使用来自另一个数据集（“obs”）（均为同一类型）的间隔和类来获取一个数据集（“sim”）的频率表。我尝试在 R 中使用 table () 函数，但它没有使用“obs”间隔给我称为“sim”的数据集的频率。可能有一些数据超出了“obs”定义的范围，我们的想法是那些被省略了。有没有一种简单的方法来获取这种情况下的频率表？

这是我的数据样本（向量）：

我给你留下代码行：

这是我从“obs”频率表中得到的：

这是我从“sim”频率表中得到的：

这与“obs”表中的频率相同。思路是统计“obs”类定义的每个区间中“sim”的元素，省略“obs”范围外的极值。

如果有人可以指导我，那将很有帮助。非常感谢！！

r frequency frequency-analysis frequency-table

2020-12-17T20:59:03.693

0 投票

1 回答

238 浏览

r - 如何将频率表转换为数据框以制作条形图？

我认为标题并没有真正的帮助，但是......让我们走吧。
我有关于候选人推文的数据。它是一个数据框，其中一个名为“推文”的列（每一行我都有不同的推文）。我使用以下函数制作频率表：

之后，我得到了这样的结果（一个大表，没有列名，其中行是不同的单词，其对应的频率如下）：

格式dput：

（想象数字在单词下方）等等（我认为我有大约 500 次出现）........

现在我想在一个简单的条形图中显示这些结果，但我很努力。
我试过类似的东西：

它不起作用......我做了一些研究，发现了一些提示，例如：将其转换为数据框，然后继续使用 ggplot，但我真的被卡住了。

r string dataframe bar-chart frequency-table

2020-12-19T18:23:48.380

0 投票

1 回答

27 浏览

r - 使用 R 和 Table 函数，我可以使用较大数据集中的 4 个特定列来创建一个二乘二的频率表

我有几列

我想使用表函数或更方便的方法将这些列转换为

更新示例

r frequency-table

2021-03-18T19:29:12.233

0 投票

0 回答

19 浏览

python - 试图让python函数返回频率表

我的 csv 文件在索引 2 处有一行用于一系列汽车的制造。我希望输出返回制造汽车的列表以及制造在列中出现的次数。

到目前为止，此代码仅返回 {2:1}。

我错过了什么？

python frequency-table

2021-03-19T18:27:41.347

0 投票

1 回答

256 浏览

r - 从 R 中的李克特量表数据创建频率表

在 R 中，一项看似简单的任务已被证明非常困难。我正在处理包含命题的调查数据，这些命题要求受访者在 7 点李克特量表上表明他们同意或不同意的程度。我正在尝试创建频率表（参见下面的表 1），以显示每个性别/年龄组类别中选择强烈同意、略微同意、同意、中立等的受访者比例，以回应每个提议。

如何从表 2 创建表 1（这是我在 R 中设置当前数据框的方式）？在表 2 中，标题为 Q31、Q32、Q33 和 Q34 的列分别是独立的命题，单元格中的值是李克特量表上 7 个选项的数字代码。

表格1

性别	年龄阶层	问题	非常同意
1	30 - 39	31	0.21
2	30 - 39	31	0.48
1	40 - 49	31	0.12
2	40 - 49	31	0.65

表 2

性别	年龄阶层	Q31	Q32	Q33	Q34
1	30 - 39	1	7	1	5
2	30 - 39	3	5	2	6
1	40 - 49	4	6	3	2
2	40 - 49	2	2	4	2

对任何建议持开放态度，因为我已经反对这个问题太久了！谢谢！

r survey likert frequency-table

2021-04-05T18:17:22.467

0 投票

2 回答

413 浏览

python - 在 Python 中创建频率分布表

我是 Python 和 Pandas 的新手，我正在努力从我的 df 创建一个频率分布表。

我的数据框是这样的：

天平	重量
10	7
11	15
12	30
13	20
10	15
13	20

编辑：余额编号是其各自的 ID

我需要使用的每个天平的频率（在本例中，天平 10 将是 2，依此类推）测量结果的最小值、最大值和平均值。

我打算使用 df.groupby(['balances']) 但我如何使用 df.groupby 的结果表单来创建一个新表？是这样吗？

python pandas frequency-distribution frequency-table

2021-04-07T15:12:27.520

0 投票

1 回答

224 浏览

r - 如何在R中使用频率表获得中位数？

问题

我已经改变了我的问题的表述，因为似乎缺乏明确性。

所以，我们有数千家医院。他们的患者年龄在 0 到 100 岁之间。对于每个年龄，他们都有一定数量的患者，例如医院 1 有 10 名 1 岁的患者，12 名两岁的患者，0 名 100 岁的患者等。

上述数据集是一个小型简化示例，我的实际数据集包含数千家医院和数百万患者的数据。

寻求的结果

我想知道每家医院的患者年龄中位数。

到目前为止的解决方案

展开表格，使每个患者的年龄有一个单独的行，然后取中位数。这将导致我的表有数亿行，所以是不可取的。

r median frequency-table

2021-05-17T11:43:13.807

0 投票

0 回答

11 浏览

r - 完全从 R 中的列表中删除重复值

与需要整个列表的唯一值的其他请求相比，该请求的目的是删除所有出现多次的值，而不是保留它们。

目标是列出以下内容：

我的尝试是创建一个 f 表以获得频率：

这将产生以下输出：

这里有一个相关的请求：如何在 R 中的（频率）表中删除具有特定值的行？但这是一种将频率表转换为数据框的解决方案。我想知道有没有直接的方法。

我感谢有关如何处理此任务的任何帮助或想法。

r list duplicates frequency-table

2021-12-01T11:27:47.500

0 投票

0 回答

39 浏览

r - 包含零计数但仅适用于我的数据框中存在的变量组合的频率表

您好，我是这个论坛的新手，并且在 R 中编码相对较新。我在构建频率表时遇到问题，当我的一些变量被链接时，该表填充零计数。我的测试数据包括 3 个植被属的植被计数，在 10 个地块中，有 2 种处理类型和两种子站点类型。我的每个地块只能是湿的或干的，治疗或控制不能两者兼而有之。

以下是我的数据的结构：

“tbl”，“data.frame”））

我正在尝试构建一个表格，其中包含 Plot ID、子站点（湿或干）、处理（OTC 或对照）、年份（2010 或 2021）、属和丰度计数。我也想包括零，所以我需要知道什么时候没有找到特定的属。我已经能够构建一个填充零计数的频率表，但问题是它还创建了我的数据集中不存在的变量组合。例如，地块 1A 始终位于经过 OTC 处理的干燥子站点中。然而，代码为地块 1A、湿子站点、OTC 和地块 1A、干子站点、控制等创建了一行...我正在寻找一种方法来链接我的地块、子站点和处理变量，以便丰度计数为零填写我的数据集中实际存在的绘图、子站点和处理的组合。

看起来它们应该是我最好的选择的功能是 tidyverse 的扩展和嵌套功能，但我愿意接受任何和所有建议！

**** 编辑以包含解决方案

r tidyr frequency-table

2021-12-16T23:06:14.820

0 投票

2 回答

38 浏览

r - 如何为分类变量创建频率表？

我是 R 新手，正在使用一个数据集，该数据集涉及在调查中收集的人们最喜欢的颜色。

我只是有一个重复颜色的响应列表，所以我想制作一个我可以使用的频率表（以创建堆积条形图或饼图）。

我尝试只使用“表格”功能，但在制作绘图时我无法进一步使用创建的表格。

以下是数据示例：mostFav

r categorical-data frequency-table

2022-01-25T02:24:32.077

问题标签 [frequency-table]

Reference