问题标签 [tapply]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
7 回答
3527 浏览

r - How do I do a conditional sum which only looks between certain date criteria

Say I have data that looks like

to get the cumulative sum per user per data point I was doing

output from this looks like

However I want to restrict my sum to only add up those that happened within 3 days of each row (relative to the user). i.e. the output needs to look like this:

0 投票
1 回答
145 浏览

r - 在R中进行一轮后按整数因子应用总和

这是我的问题:我得到了 3000 obs 的数据。和 5000 个功能,3000 个 obs。有一个像 100.1,100.3,100.5,100.7 这样的数字名称。我将名称更改为整数变量segs <-as.integer(names),然后我想将其segs用作对所有 3000 个特征求和的因素。的长度segs是 300,所以最终的数据帧是 300 x 5000。我知道tapply可以用来按因子计算一个变量的总和,但我必须用它for来对所有 5000 个特征求和。这真的很耗时,所以我想知道R中是否有明确的方法来解决这些问题,或者是否有一些包可以解决这类问题。

这是脏代码,是我想要df0的数据:df

谢谢!

=====

谢谢,Roland,演示数据如下所示:

0 投票
3 回答
917 浏览

r - 使用带有 strptime() 格式化日期的 tapply()

我只想从一天中定期获取的一组值中计算出每日平均值,但是对于数据集中的多个不同日期。当我的日期是一个因素时,tapply() 很棒

这正是我想要的,但这些日期不再按时间顺序排列,因为我已经将其作为一个因素。

相反,我尝试使用 strptime() 作为 R 识别的日期格式。从头开始......

但我只是收到以下错误消息?有谁知道为什么这不起作用?

0 投票
2 回答
54 浏览

r - 如何使用循环 for 和 if

这是我的示例数据集

我想计算列 V2 的唯一值,因此结果将是:

我已经开始编写我的代码,但我不知道 - 这应该是什么样子:

我知道非常简单的解决方案,例如:

但我的任务是使用循环功能 - 可能是 for 和 if

0 投票
1 回答
147 浏览

r - 点击只产生缺失值

我正在尝试估算一个国家特定城市内天主教徒的百分比,并且我正在使用多层次回归和调查数据的后分层。

该方法适合多级 logit 并生成因变量的预测概率。然后,它使用样本的后分层对人口普查数据进行加权概率。

我可以生成初始估计值(这基本上只是调查数据中给定个人的天主教徒的预测概率。)但是,当我尝试使用下面最后一行代码取平均值时,它只返回每个人的 NA直辖市。最初的细胞预测有一些缺失值,但远不及多数。

我不明白为什么我无法生成市政加权平均值,因为我使用不同的数据遵循了该程序。任何帮助将不胜感激。

0 投票
2 回答
4804 浏览

r - 有没有办法让 tapply 使用两个索引值(或等效)?

我有一个看起来像这样的数据框:

我想要的是和的每个组合的最大值(value所有AX的最大值,所有AY的最大值等......)index1index2

我试过tapply这样使用:

...但这显然行不通。

有没有办法tapply使用 2 个索引条件或者有更好的方法来解决这个问题?

0 投票
1 回答
2289 浏览

r - 汇总 ggplot 使用的纬度、经度和计数数据

我收到了一些纬度、经度和计数格式的客户数据。创建 ggplot 热图所需的所有数据都存在,但我不知道如何将其放入 ggplot 所需的格式。

我试图通过 0.01 Lat 和 0.01 Lon 块(典型的热图)内的总计数来聚合数据,我本能地认为“点击”。这会根据需要按块大小创建一个很好的摘要,但格式错误。此外,我真的很想将空的 Lat 或 Lon 块值包含为零,即使那里什么都没有……否则热图最终看起来很奇怪。

我在下面的代码中创建了我的数据子集供您参考:

0 投票
1 回答
272 浏览

r - *apply 函数中 'fun=' 的值

*apply(apply、tapply、lapply 等)是一种非常有用且直接的方法,可以在数据数组中应用函数,具有通用结构:

但是,我找不到有效函数的列表。

任何人都可以提供此类列表的链接吗?

0 投票
1 回答
257 浏览

r - 将 tapply 应用于向量时出现语法错误

我正在练习 R 编程课程的讲座,在他演示 tapply() 函数的其中一个讲座中,我只是复制粘贴了讲座中教授的内容,但出现语法错误

结果应如下所示

但我得到的是一个错误值

0 投票
2 回答
1072 浏览

r - Subtract minimum of the column based on other column

I have a dataframe as follows:

I want to have difference of total and its minimum in each group determined by file.
I can think of getting the minimum with:

but I can't think of wise way to get the vector with subtracted minimums.