问题标签 [tapply]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - How do I do a conditional sum which only looks between certain date criteria
Say I have data that looks like
to get the cumulative sum per user per data point I was doing
output from this looks like
However I want to restrict my sum to only add up those that happened within 3 days of each row (relative to the user). i.e. the output needs to look like this:
r - 在R中进行一轮后按整数因子应用总和
这是我的问题:我得到了 3000 obs 的数据。和 5000 个功能,3000 个 obs。有一个像 100.1,100.3,100.5,100.7 这样的数字名称。我将名称更改为整数变量segs <-as.integer(names)
,然后我想将其segs
用作对所有 3000 个特征求和的因素。的长度segs
是 300,所以最终的数据帧是 300 x 5000。我知道tapply
可以用来按因子计算一个变量的总和,但我必须用它for
来对所有 5000 个特征求和。这真的很耗时,所以我想知道R中是否有明确的方法来解决这些问题,或者是否有一些包可以解决这类问题。
这是脏代码,是我想要df0
的数据:df
谢谢!
=====
谢谢,Roland,演示数据如下所示:
r - 使用带有 strptime() 格式化日期的 tapply()
我只想从一天中定期获取的一组值中计算出每日平均值,但是对于数据集中的多个不同日期。当我的日期是一个因素时,tapply() 很棒
这正是我想要的,但这些日期不再按时间顺序排列,因为我已经将其作为一个因素。
相反,我尝试使用 strptime() 作为 R 识别的日期格式。从头开始......
但我只是收到以下错误消息?有谁知道为什么这不起作用?
r - 如何使用循环 for 和 if
这是我的示例数据集
我想计算列 V2 的唯一值,因此结果将是:
我已经开始编写我的代码,但我不知道 - 这应该是什么样子:
我知道非常简单的解决方案,例如:
但我的任务是使用循环功能 - 可能是 for 和 if
r - 点击只产生缺失值
我正在尝试估算一个国家特定城市内天主教徒的百分比,并且我正在使用多层次回归和调查数据的后分层。
该方法适合多级 logit 并生成因变量的预测概率。然后,它使用样本的后分层对人口普查数据进行加权概率。
我可以生成初始估计值(这基本上只是调查数据中给定个人的天主教徒的预测概率。)但是,当我尝试使用下面最后一行代码取平均值时,它只返回每个人的 NA直辖市。最初的细胞预测有一些缺失值,但远不及多数。
我不明白为什么我无法生成市政加权平均值,因为我使用不同的数据遵循了该程序。任何帮助将不胜感激。
r - 有没有办法让 tapply 使用两个索引值(或等效)?
我有一个看起来像这样的数据框:
我想要的是和的每个组合的最大值(value
即所有AX的最大值,所有AY的最大值等......)index1
index2
我试过tapply
这样使用:
...但这显然行不通。
有没有办法tapply
使用 2 个索引条件或者有更好的方法来解决这个问题?
r - 汇总 ggplot 使用的纬度、经度和计数数据
我收到了一些纬度、经度和计数格式的客户数据。创建 ggplot 热图所需的所有数据都存在,但我不知道如何将其放入 ggplot 所需的格式。
我试图通过 0.01 Lat 和 0.01 Lon 块(典型的热图)内的总计数来聚合数据,我本能地认为“点击”。这会根据需要按块大小创建一个很好的摘要,但格式错误。此外,我真的很想将空的 Lat 或 Lon 块值包含为零,即使那里什么都没有……否则热图最终看起来很奇怪。
我在下面的代码中创建了我的数据子集供您参考:
r - *apply 函数中 'fun=' 的值
*apply(apply、tapply、lapply 等)是一种非常有用且直接的方法,可以在数据数组中应用函数,具有通用结构:
但是,我找不到有效函数的列表。
任何人都可以提供此类列表的链接吗?
r - 将 tapply 应用于向量时出现语法错误
我正在练习 R 编程课程的讲座,在他演示 tapply() 函数的其中一个讲座中,我只是复制粘贴了讲座中教授的内容,但出现语法错误
结果应如下所示
但我得到的是一个错误值
r - Subtract minimum of the column based on other column
I have a dataframe as follows:
I want to have difference of total and its minimum in each group determined by file.
I can think of getting the minimum with:
but I can't think of wise way to get the vector with subtracted minimums.