问题标签 [frequency-table]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何从一个数据集中获取 R 中的频率表,使用间隔和中断形成不同的数据集?
我试图使用来自另一个数据集(“obs”)(均为同一类型)的间隔和类来获取一个数据集(“sim”)的频率表。我尝试在 R 中使用 table () 函数,但它没有使用“obs”间隔给我称为“sim”的数据集的频率。可能有一些数据超出了“obs”定义的范围,我们的想法是那些被省略了。有没有一种简单的方法来获取这种情况下的频率表?
这是我的数据样本(向量):
我给你留下代码行:
这是我从“obs”频率表中得到的:
这是我从“sim”频率表中得到的:
这与“obs”表中的频率相同。思路是统计“obs”类定义的每个区间中“sim”的元素,省略“obs”范围外的极值。
如果有人可以指导我,那将很有帮助。非常感谢!!
r - 如何将频率表转换为数据框以制作条形图?
我认为标题并没有真正的帮助,但是......让我们走吧。
我有关于候选人推文的数据。它是一个数据框,其中一个名为“推文”的列(每一行我都有不同的推文)。我使用以下函数制作频率表:
之后,我得到了这样的结果(一个大表,没有列名,其中行是不同的单词,其对应的频率如下):
格式dput
:
(想象数字在单词下方)等等(我认为我有大约 500 次出现)........
现在我想在一个简单的条形图中显示这些结果,但我很努力。
我试过类似的东西:
它不起作用......我做了一些研究,发现了一些提示,例如:将其转换为数据框,然后继续使用 ggplot,但我真的被卡住了。
r - 使用 R 和 Table 函数,我可以使用较大数据集中的 4 个特定列来创建一个二乘二的频率表
我有几列
我想使用表函数或更方便的方法将这些列转换为
更新示例
python - 试图让python函数返回频率表
我的 csv 文件在索引 2 处有一行用于一系列汽车的制造。我希望输出返回制造汽车的列表以及制造在列中出现的次数。
到目前为止,此代码仅返回 {2:1}。
我错过了什么?
r - 从 R 中的李克特量表数据创建频率表
在 R 中,一项看似简单的任务已被证明非常困难。我正在处理包含命题的调查数据,这些命题要求受访者在 7 点李克特量表上表明他们同意或不同意的程度。我正在尝试创建频率表(参见下面的表 1),以显示每个性别/年龄组类别中选择强烈同意、略微同意、同意、中立等的受访者比例,以回应每个提议。
如何从表 2 创建表 1(这是我在 R 中设置当前数据框的方式)?在表 2 中,标题为 Q31、Q32、Q33 和 Q34 的列分别是独立的命题,单元格中的值是李克特量表上 7 个选项的数字代码。
表格1
性别 | 年龄阶层 | 问题 | 非常同意 |
---|---|---|---|
1 | 30 - 39 | 31 | 0.21 |
2 | 30 - 39 | 31 | 0.48 |
1 | 40 - 49 | 31 | 0.12 |
2 | 40 - 49 | 31 | 0.65 |
表 2
性别 | 年龄阶层 | Q31 | Q32 | Q33 | Q34 |
---|---|---|---|---|---|
1 | 30 - 39 | 1 | 7 | 1 | 5 |
2 | 30 - 39 | 3 | 5 | 2 | 6 |
1 | 40 - 49 | 4 | 6 | 3 | 2 |
2 | 40 - 49 | 2 | 2 | 4 | 2 |
对任何建议持开放态度,因为我已经反对这个问题太久了!谢谢!
python - 在 Python 中创建频率分布表
我是 Python 和 Pandas 的新手,我正在努力从我的 df 创建一个频率分布表。
我的数据框是这样的:
天平 | 重量 |
---|---|
10 | 7 |
11 | 15 |
12 | 30 |
13 | 20 |
10 | 15 |
13 | 20 |
编辑:余额编号是其各自的 ID
我需要使用的每个天平的频率(在本例中,天平 10 将是 2,依此类推)测量结果的最小值、最大值和平均值。
我打算使用 df.groupby(['balances']) 但我如何使用 df.groupby 的结果表单来创建一个新表?是这样吗?
r - 完全从 R 中的列表中删除重复值
与需要整个列表的唯一值的其他请求相比,该请求的目的是删除所有出现多次的值,而不是保留它们。
目标是列出以下内容:
我的尝试是创建一个 f 表以获得频率:
这将产生以下输出:
这里有一个相关的请求:如何在 R 中的(频率)表中删除具有特定值的行?但这是一种将频率表转换为数据框的解决方案。我想知道有没有直接的方法。
我感谢有关如何处理此任务的任何帮助或想法。
r - 包含零计数但仅适用于我的数据框中存在的变量组合的频率表
您好,我是这个论坛的新手,并且在 R 中编码相对较新。我在构建频率表时遇到问题,当我的一些变量被链接时,该表填充零计数。我的测试数据包括 3 个植被属的植被计数,在 10 个地块中,有 2 种处理类型和两种子站点类型。我的每个地块只能是湿的或干的,治疗或控制不能两者兼而有之。
以下是我的数据的结构:
“tbl”,“data.frame”))
我正在尝试构建一个表格,其中包含 Plot ID、子站点(湿或干)、处理(OTC 或对照)、年份(2010 或 2021)、属和丰度计数。我也想包括零,所以我需要知道什么时候没有找到特定的属。我已经能够构建一个填充零计数的频率表,但问题是它还创建了我的数据集中不存在的变量组合。例如,地块 1A 始终位于经过 OTC 处理的干燥子站点中。然而,代码为地块 1A、湿子站点、OTC 和地块 1A、干子站点、控制等创建了一行...我正在寻找一种方法来链接我的地块、子站点和处理变量,以便丰度计数为零填写我的数据集中实际存在的绘图、子站点和处理的组合。
看起来它们应该是我最好的选择的功能是 tidyverse 的扩展和嵌套功能,但我愿意接受任何和所有建议!
**** 编辑以包含解决方案
r - 如何为分类变量创建频率表?
我是 R 新手,正在使用一个数据集,该数据集涉及在调查中收集的人们最喜欢的颜色。
我只是有一个重复颜色的响应列表,所以我想制作一个我可以使用的频率表(以创建堆积条形图或饼图)。
我尝试只使用“表格”功能,但在制作绘图时我无法进一步使用创建的表格。
以下是数据示例:mostFav