问题标签 [tapply]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
206 浏览

r - 从更大的矩阵中计算来自多个位置的 4 个子位置集的平均值

我正在对圆管的壁厚测量进行数据分析。我有以下矩阵:

Sub.location 列具有值 A、B、C、D。它们是在相同测量位置但在横截面中不同位置的测量。所以沿着管子在 0、90、180、270 度。

我想绘制一个图,其中可以清楚地看出哪个测量位置在时间上具有最大的壁厚减少。

为此,我首先要在每个唯一间隔(运行时间与间隔耦合)的每个测量位置计算管壁厚度的平均值。

我尝试使用以下公式执行此操作:

这似乎不起作用。我想保留 tapply 函数,因为我还用它计算了一些值的标准偏差,它让我可以轻松地制作图。

有人对如何解决这个问题有任何建议吗?

0 投票
1 回答
788 浏览

r - 如果没有 FUN,tapply(x,index) 是什么意思?

我知道代码中的含义tapply(dat$sale,list(dat$year,dat$province),sum)

tapply(dat$sale,list(dat$year,dat$province))如果里面没有FUN是什么意思?

它是一个下标,结果是什么意思12? 我可以在哪个规则中获得或?如何计算它?9
129

0 投票
1 回答
55 浏览

r - 我可以将 tapply 更改为聚合以获得相同的结果吗?

在这种情况下,如何将 tapply 更改为聚合以获得相同的结果?

0 投票
1 回答
1942 浏览

r - R - 修改 tapply 函数中的级别顺序

我有如下数据

我想计算一些东西,想知道是否有人可以帮助提供以下代码

  1. a每个值的平均值nums(例如,上面的平均值a1 30.5,按最高平均值排序a。我tapply想解决这个问题,但我不知道如何处理排序组件。
  2. a每个值的平均值nums,按预定nums顺序排序。例如,类似tapply(df$ac, df$nums, mean, orderBy=c("1 3", "4 6", "8 1", etc.)). 您可以假设我有一个涵盖所有可能nums值的排序。
0 投票
1 回答
1202 浏览

r - 将多列相乘并找到多个值的每一列的总和

我正在尝试将列相乘并获取其名称。我有一个数据框:

我正在尝试将每一列与其他列相乘,例如:

和 v2v3 v2v4 v2v5

等等,以及

4 组合和 5 组合...如果有 n 列,则 n 组合。

我尝试在 while 循环中使用以下代码,但它不起作用:

但它不工作。

样品输出..

如果 n=3

和colsum

然后

这是我正在尝试的吗?

0 投票
1 回答
43 浏览

r - 隐藏特定行中的多行

我想转换这些数据:

在该格式中,使用具有多个基因型的“E”样本标记并将具有相同基因型的样本统一 2 次:

我有一个包含许多区域的列表(Region1 - Regionx)。可以在R软件中做吗?非常感谢。

0 投票
2 回答
2483 浏览

r - 使用应用族对不同因子水平进行汇总统计

我正在尝试查找不同因子水平的汇总统计数据。

现在我有不同的值company- 我可以为不同的值重复该语句。我知道它可以自动化 - 使用 apply family ( ddply, tapply, sapply),但我没有做对。

0 投票
2 回答
990 浏览

r - 如何在 R 中按组汇总日期数据

我想将以下示例数据汇总到一个新的数据框中,如下所示:

人口、样本量 (N)、完成百分比 (%)

样本大小是每个总体的所有记录的计数。我可以使用 table 命令或 tapply 来做到这一点。完成百分比是带有“结束日期”的记录的百分比(所有没有“结束日期”的记录都被假定为未完成。这就是我迷路的地方!

样本数据

0 投票
1 回答
195 浏览

r - 我想根据两个因素计算 z 分数,有没有办法做到这一点?

我想根据两个因素计算总和量表的 z 分数:性别和年龄组(四个因素)。

我怎么能在 R 中做到这一点?我对R真的很陌生,才开始学习,我遇到了

但结果不是数据框。我怎样才能把它变成一个数据框?或者还有其他方法吗?

0 投票
2 回答
6417 浏览

python - Python Pandas 中 R 的 tapply() 等价物

我有一个数据集,其中包含 3 只动物的喂养数据,包括动物的标签 ID(1、2、3)、每顿“餐”中提供的饲料类型(A、B)和数量(kg):

在base R中,我可以很容易地输出下面的矩阵,unique('Animal')它的行、unique('FeedType')列和Amount (kg)矩阵的相应单元格中的累积值tapply()如下所示

Python Pandas 数据框是否有等效功能?在 Pandas 中实现这一目标的最优雅和最快的方法是什么?

PS我希望能够指定在什么列上,在这种情况下Amount,执行聚合。

提前致谢。

编辑:

我在两个答案中都尝试了这两种方法。使用我的 216,347 行和 15 列的实际 Pandas 数据框的性能结果:

给出:

所以就我而言,pivot_table() 工作得更快。