问题标签 [tapply]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 从更大的矩阵中计算来自多个位置的 4 个子位置集的平均值
我正在对圆管的壁厚测量进行数据分析。我有以下矩阵:
Sub.location 列具有值 A、B、C、D。它们是在相同测量位置但在横截面中不同位置的测量。所以沿着管子在 0、90、180、270 度。
我想绘制一个图,其中可以清楚地看出哪个测量位置在时间上具有最大的壁厚减少。
为此,我首先要在每个唯一间隔(运行时间与间隔耦合)的每个测量位置计算管壁厚度的平均值。
我尝试使用以下公式执行此操作:
这似乎不起作用。我想保留 tapply 函数,因为我还用它计算了一些值的标准偏差,它让我可以轻松地制作图。
有人对如何解决这个问题有任何建议吗?
r - 如果没有 FUN,tapply(x,index) 是什么意思?
我知道代码中的含义tapply(dat$sale,list(dat$year,dat$province),sum)
:
tapply(dat$sale,list(dat$year,dat$province))
如果里面没有FUN是什么意思?
它是一个下标,结果是什么意思12
?
我可以在哪个规则中获得或?如何计算它?9
12
9
r - 我可以将 tapply 更改为聚合以获得相同的结果吗?
在这种情况下,如何将 tapply 更改为聚合以获得相同的结果?
r - R - 修改 tapply 函数中的级别顺序
我有如下数据
我想计算一些东西,想知道是否有人可以帮助提供以下代码
a
每个值的平均值nums
(例如,上面的平均值a
是1 3
)0.5
,按最高平均值排序a
。我tapply
想解决这个问题,但我不知道如何处理排序组件。a
每个值的平均值nums
,按预定nums
顺序排序。例如,类似tapply(df$ac, df$nums, mean, orderBy=c("1 3", "4 6", "8 1", etc.))
. 您可以假设我有一个涵盖所有可能nums
值的排序。
r - 将多列相乘并找到多个值的每一列的总和
我正在尝试将列相乘并获取其名称。我有一个数据框:
我正在尝试将每一列与其他列相乘,例如:
和 v2v3 v2v4 v2v5
等等,以及
4 组合和 5 组合...如果有 n 列,则 n 组合。
我尝试在 while 循环中使用以下代码,但它不起作用:
但它不工作。
样品输出..
如果 n=3
和colsum
然后
这是我正在尝试的吗?
r - 隐藏特定行中的多行
我想转换这些数据:
在该格式中,使用具有多个基因型的“E”样本标记并将具有相同基因型的样本统一 2 次:
我有一个包含许多区域的列表(Region1 - Regionx)。可以在R软件中做吗?非常感谢。
r - 使用应用族对不同因子水平进行汇总统计
我正在尝试查找不同因子水平的汇总统计数据。
现在我有不同的值company
- 我可以为不同的值重复该语句。我知道它可以自动化 - 使用 apply family ( ddply
, tapply
, sapply
),但我没有做对。
r - 如何在 R 中按组汇总日期数据
我想将以下示例数据汇总到一个新的数据框中,如下所示:
人口、样本量 (N)、完成百分比 (%)
样本大小是每个总体的所有记录的计数。我可以使用 table 命令或 tapply 来做到这一点。完成百分比是带有“结束日期”的记录的百分比(所有没有“结束日期”的记录都被假定为未完成。这就是我迷路的地方!
样本数据
r - 我想根据两个因素计算 z 分数,有没有办法做到这一点?
我想根据两个因素计算总和量表的 z 分数:性别和年龄组(四个因素)。
我怎么能在 R 中做到这一点?我对R真的很陌生,才开始学习,我遇到了
但结果不是数据框。我怎样才能把它变成一个数据框?或者还有其他方法吗?
python - Python Pandas 中 R 的 tapply() 等价物
我有一个数据集,其中包含 3 只动物的喂养数据,包括动物的标签 ID(1、2、3)、每顿“餐”中提供的饲料类型(A、B)和数量(kg):
在base R中,我可以很容易地输出下面的矩阵,unique('Animal')
它的行、unique('FeedType')
列和Amount (kg)
矩阵的相应单元格中的累积值tapply()
如下所示
Python Pandas 数据框是否有等效功能?在 Pandas 中实现这一目标的最优雅和最快的方法是什么?
PS我希望能够指定在什么列上,在这种情况下Amount
,执行聚合。
提前致谢。
编辑:
我在两个答案中都尝试了这两种方法。使用我的 216,347 行和 15 列的实际 Pandas 数据框的性能结果:
给出:
所以就我而言,pivot_table() 工作得更快。