问题标签 [frequency-table]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何从 R 中非常大的频率表中提取特定频率?
我正在制作基因在我的测序样本中出现的次数的频率表(来自一长串基因序列)。我一直很好地使用 ftable() 函数,但我正在缩小搜索范围,并希望专注于数千个特定基因中的几个。
我目前的工作流程如下:
- 我为样本中的所有基因创建频率表。
- 将此表导出到 csv。
- 在 Excel 中使用 control+f 拉出我感兴趣的特定基因频率。
考虑到我计划分析的样本数量,这似乎非常低效。
有没有办法使用 R 提取频率表中的某些条目?
到目前为止,我已经尝试了 [c(, , ,)] 和 a[, , ,] 方法无济于事。我一直收到“意外符号”错误。
我希望问题不在于基因名称中的连字符,因为我无法删除它。
我附上了我的 R 窗口的屏幕截图以供参考。
structure(list(Sequence.number = c(1L, 2L, 4L, 5L, 6L, 7L, 10L,
11L, 13L, 14L), Variable = structure(c(25L, 2L, 22L, 19L, 19L,
19L, 7L, 1L, 25L, 19L), .Label = c("V1-13", "V1-18", "V1-2",
"V1-21", "V1-36", "V1-39", "V1-42", "V10D-9", "V11-25", "V12D-36",
"V12D-56", "V15D-54", "V1D-15", "V1D-73", "V3-20", "V3D-30",
"V4D-24", "V4D-43", "V4D-60", "V6-31", "V6-35", "V6-4", "V6D-40",
"V6D-76", "V8-30", "V8-46", "V8-5", "V9-15", "V9-23", "V9D-2"
), class = "factor"), Diversity = structure(c(13L, 17L, 2L, 5L,
3L, 5L, 2L, 14L, 13L, 15L), .Label = c("", "D1", "D1T1", "D1T2",
"D2", "D2D", "D2T1", "D2T1D", "D2T2", "D3", "D3T1", "D3T1D",
"D4", "D4T1D", "D5", "D5T1D", "D6"), class = "factor"), Joining = structure(c(1L,
7L, 8L, 8L, 4L, 8L, 1L, 9L, 1L, 8L), .Label = c("J1", "J1T1",
"J1T2", "J2", "J2D", "J2T1", "J3", "J4", "J5", "J6D"), class = "factor")), row.names = c(NA,
10L), class = "data.frame")
r - 如何合并R中频率表上的属性?
假设我有两个变量。请参阅下面的虚拟数据:
在 250 条记录中:
性别
男:100
女性:150
头发
短:110
长:140
下面提供了我当前使用的代码,为每个变量创建了一个不同的表:
我的问题是如何合并 R 中具有以下格式的两个表以及计算每组级别的频率百分比:
r - R中的频率计数
我希望它显示国内总频率(包括波士顿+盐湖城)和国际总频率(伦敦+上海)的频率表。但它会像这样打印出来。
所以,最后表格应该是这样的:
- 国内:413
- 国际:286
我究竟做错了什么?
r - 返回具有匹配条件的元素计数的表
我是堆栈溢出的新手。我在 R 方面有一些经验,但不是很多。我想我想要实现的目标很简单,但我不知道如何获得它。
我有一个由四列组成的数据框:参与者 ID、试验 ID、问题 ID 和结果。在简化版本中,它看起来像这样:
我怎样才能得到一个表格,我可以在其中看到每个试验和参与者的“通过”问题的数量。看起来像这样的东西:
如果我使用“表格”功能,我只会得到参与者和试验的每个组合出现在数据框行中的频率。
有任何想法吗?先感谢您。
r - 如何找到填充矩阵中值最多的行?
给定这样的矩阵(mat1):
我将如何查找具有最多非空字符串值的前 3 行?例如在mat1中,第1行有3个值,第2行有2个值,第3行有4个值,第4行有4个值。
有没有一种方法可以让我在某种频率表中将其制成表格,或者至少返回顶部行的向量?
python - Pandas value_counts() 在同一行中有多个匹配项
我有分类数据(A
,B
等),其中多个匹配项可以存在于同一字段中,例如A,B
. 我想将我的数据分成额外的行,只是为了计算每个值的实例数。
目前:
我理想的功能是这样的:
r - 使用 purrr::map 对列进行分组并获取频率
我正在尝试使用 tidyverse 代码获取多列的交叉表。
样本数据:
使用 apply,我会执行以下操作:
我试过下面的代码不起作用:
r - R中的汇总函数没有给出频率表
当我summary()
在 R 中使用函数时,它给了我连续数值变量的正确输出,但它没有给我字符变量的频率表。我的同事在相同的数据集上使用相同的代码并获取频率表。我有 R 的最新版本。我该怎么做才能让摘要为我工作?(注意:无论我使用什么数据集,甚至是 R 教程中的数据集,它都不会起作用。)这是我得到的输出:
这是她得到的输出: