问题标签 [frequency-table]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
122 浏览

r - 如何从一个数据集中获取 R 中的频率表,使用间隔和中断形成不同的数据集?

我试图使用来自另一个数据集(“obs”)(均为同一类型)的间隔和类来获取一个数据集(“sim”)的频率表。我尝试在 R 中使用 table () 函数,但它没有使用“obs”间隔给我称为“sim”的数据集的频率。可能有一些数据超出了“obs”定义的范围,我们的想法是那些被省略了。有没有一种简单的方法来获取这种情况下的频率表?

这是我的数据样本(向量):

我给你留下代码行:

这是我从“obs”频率表中得到的:

这是我从“sim”频率表中得到的:

这与“obs”表中的频率相同。思路是统计“obs”类定义的每个区间中“sim”的元素,省略“obs”范围外的极值。

如果有人可以指导我,那将很有帮助。非常感谢!!

0 投票
1 回答
238 浏览

r - 如何将频率表转换为数据框以制作条形图?

我认为标题并没有真正的帮助,但是......让我们走吧。
我有关于候选人推文的数据。它是一个数据框,其中一个名为“推文”的列(每一行我都有不同的推文)。我使用以下函数制作频率表:

之后,我得到了这样的结果(一个大表,没有列名,其中行是不同的单词,其对应的频率如下):

格式dput

(想象数字在单词下方)等等(我认为我有大约 500 次出现)........

现在我想在一个简单的条形图中显示这些结果,但我很努力。
我试过类似的东西:

它不起作用......我做了一些研究,发现了一些提示,例如:将其转换为数据框,然后继续使用 ggplot,但我真的被卡住了。

0 投票
1 回答
27 浏览

r - 使用 R 和 Table 函数,我可以使用较大数据集中的 4 个特定列来创建一个二乘二的频率表

我有几列

我想使用表函数或更方便的方法将这些列转换为

更新示例

0 投票
0 回答
19 浏览

python - 试图让python函数返回频率表

我的 csv 文件在索引 2 处有一行用于一系列汽车的制造。我希望输出返回制造汽车的列表以及制造在列中出现的次数。

到目前为止,此代码仅返回 {2:1}。

我错过了什么?

0 投票
1 回答
256 浏览

r - 从 R 中的李克特量表数据创建频率表

在 R 中,一项看似简单的任务已被证明非常困难。我正在处理包含命题的调查数据,这些命题要求受访者在 7 点李克特量表上表明他们同意或不同意的程度。我正在尝试创建频率表(参见下面的表 1),以显示每个性别/年龄组类别中选择强烈同意、略微同意、同意、中立等的受访者比例,以回应每个提议。

如何从表 2 创建表 1(这是我在 R 中设置当前数据框的方式)?在表 2 中,标题为 Q31、Q32、Q33 和 Q34 的列分别是独立的命题,单元格中的值是李克特量表上 7 个选项的数字代码。

表格1

性别 年龄阶层 问题 非常同意
1 30 - 39 31 0.21
2 30 - 39 31 0.48
1 40 - 49 31 0.12
2 40 - 49 31 0.65

表 2

性别 年龄阶层 Q31 Q32 Q33 Q34
1 30 - 39 1 7 1 5
2 30 - 39 3 5 2 6
1 40 - 49 4 6 3 2
2 40 - 49 2 2 4 2

对任何建议持开放态度,因为我已经反对这个问题太久了!谢谢!

0 投票
2 回答
413 浏览

python - 在 Python 中创建频率分布表

我是 Python 和 Pandas 的新手,我正在努力从我的 df 创建一个频率分布表。

我的数据框是这样的:

天平 重量
10 7
11 15
12 30
13 20
10 15
13 20

编辑:余额编号是其各自的 ID

我需要使用的每个天平的频率(在本例中,天平 10 将是 2,依此类推)测量结果的最小值、最大值和平均值。

我打算使用 df.groupby(['balances']) 但我如何使用 df.groupby 的结果表单来创建一个新表?是这样吗?

0 投票
1 回答
224 浏览

r - 如何在R中使用频率表获得中位数?

问题

我已经改变了我的问题的表述,因为似乎缺乏明确性。

所以,我们有数千家医院。他们的患者年龄在 0 到 100 岁之间。对于每个年龄,他们都有一定数量的患者,例如医院 1 有 10 名 1 岁的患者,12 名两岁的患者,0 名 100 岁的患者等。

在此处输入图像描述

上述数据集是一个小型简化示例,我的实际数据集包含数千家医院和数百万患者的数据。

寻求的结果

我想知道每家医院的患者年龄中位数。

到目前为止的解决方案

展开表格,使每个患者的年龄有一个单独的行,然后取中位数。这将导致我的表有数亿行,所以是不可取的。

0 投票
0 回答
11 浏览

r - 完全从 R 中的列表中删除重复值

与需要整个列表的唯一值的其他请求相比,该请求的目的是删除所有出现多次的值,而不是保留它们。

目标是列出以下内容:

我的尝试是创建一个 f 表以获得频率:

这将产生以下输出:

这里有一个相关的请求:如何在 R 中的(频率)表中删除具有特定值的行?但这是一种将频率表转换为数据框的解决方案。我想知道有没有直接的方法。

我感谢有关如何处理此任务的任何帮助或想法。

0 投票
0 回答
39 浏览

r - 包含零计数但仅适用于我的数据框中存在的变量组合的频率表

您好,我是这个论坛的新手,并且在 R 中编码相对较新。我在构建频率表时遇到问题,当我的一些变量被链接时,该表填充零计数。我的测试数据包括 3 个植被属的植被计数,在 10 个地块中,有 2 种处理类型和两种子站点类型。我的每个地块只能是湿的或干的,治疗或控制不能两者兼而有之。

以下是我的数据的结构:

“tbl”,“data.frame”))

我正在尝试构建一个表格,其中包含 Plot ID、子站点(湿或干)、处理(OTC 或对照)、年份(2010 或 2021)、属和丰度计数。我也想包括零,所以我需要知道什么时候没有找到特定的属。我已经能够构建一个填充零计数的频率表,但问题是它还创建了我的数据集中不存在的变量组合。例如,地块 1A 始终位于经过 OTC 处理的干燥子站点中。然而,代码为地块 1A、湿子站点、OTC 和地块 1A、干子站点、控制等创建了一行...我正在寻找一种方法来链接我的地块、子站点和处理变量,以便丰度计数为零填写我的数据集中实际存在的绘图、子站点和处理的组合。

看起来它们应该是我最好的选择的功能是 tidyverse 的扩展和嵌套功能,但我愿意接受任何和所有建议!

**** 编辑以包含解决方案

0 投票
2 回答
38 浏览

r - 如何为分类变量创建频率表?

我是 R 新手,正在使用一个数据集,该数据集涉及在调查中收集的人们最喜欢的颜色。

我只是有一个重复颜色的响应列表,所以我想制作一个我可以使用的频率表(以创建堆积条形图或饼图)。

我尝试只使用“表格”功能,但在制作绘图时我无法进一步使用创建的表格。

以下是数据示例:mostFav