问题标签 [dplyr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 R 中使用外部矩阵元素计算
我正在尝试通过用户定义的函数计算矩阵的每个元素。我使用了双for
循环、嵌套sapply
和apply
之后expand.grid
。
我正在寻找更优雅的解决方案(当然更快)。我正在尝试使用外部,我写道:
我有Error in ll[[y]] : recursive indexing failed at level 2
我认为 Outer 需要对函数进行矢量化,所以我尝试了它:
我得到了Error in ll[[x]] : subscript out of bounds
我想我在 Vectorize 中可能会出错,关于我正在尝试做的事情的一般想法,但我会很感激这里的一些帮助。我也在看plyr
/ dplyr
- 没有太大的成功。
r - 使用 dplyr 按组计算行数
我正在使用mtcars
数据集。我想查找特定数据组合的记录数。count(*)
与SQL 中的 group by 子句非常相似。ddply()
来自plyr为我工作
有输出
使用此代码
有输出
我找到了各种可以传递的函数,summarise()
但似乎没有一个对我有用。我发现的一个函数是sum(G)
,它返回
尝试使用n()
,返回
我究竟做错了什么?我怎样才能得到group_by()
/summarise()
为我工作?
c++ - 使用变量名过滤 dplyr 的 tbl_df
我在使用 dplyr 的 tbl_df 时遇到问题,分别是常规的 data.frame。我有一个很大的 tbl_df (500x30K) 并且需要过滤它。所以我想做的是:
这将类似于
效果很好。但是我需要在运行时动态构建过滤函数,所以我需要通过一个或多个变量来访问 DF/tbl_df 列。我试过类似的东西:
这给了我一个错误:与 LGLSXP 不兼容 这似乎深深植根于 Cpp 代码中。
我会感谢任何提示。还指出“字符串到环境变量”的转换会有所帮助,因为我很高兴我做错了。
用最好的,
马里奥
r - dplyr:“n() 中的错误:不应直接调用函数”
我正在尝试重现 dplyr 包中的示例之一,但收到此错误消息。我期待看到以每种组合的频率生成的新列 n。我错过了什么?我三次检查包是否已加载。
n() 中的错误:不应直接调用此函数
r - dplyr 中单个数据的概率
示例:具有许多个人和 3 个变量的数据框:年份(整数)、性别(因子:男/女)和工会(因子:是/否)。我想计算在给定年份和性别的情况下成为工会成员的概率。我通常用聚合()来做到这一点。我是否一直在这样做,我正在寻找一种在 dplyr 中快速快速的方法。
亲切的问候,彼得
r - dplyr:非标准列名(空格、标点符号、以数字开头)
数据看起来像
继调用选择
给
如何选择“a a”和/或将其重命名为没有空格的内容select
?我知道以下方法:
names(df)[1] <- "a"
select(df, a=1)
select(df, ends_with("a"))
但是如果我正在处理一个大型数据集,我如何在不知道索引号或类似列名的情况下获得完全匹配?
r - dplyr 链中的格式列
我有这个数据集:
是否可以在链中包含一列的日期格式?(我也尝试过使用with
,但只返回日期列。)
如果我不在链中包含格式,它可以工作。我知道在链外写这个很简单,但我想确认这是否可行。
r - 过滤包含特定字符串的行
我必须使用包含字符串的那些行作为标准来过滤数据框RTB
。
我正在使用dplyr
.
我知道我可以使用该函数filter
,dplyr
但我不知道如何告诉它检查字符串的内容。
特别是我想检查列中的内容TrackingPixel
。如果字符串包含RTB
我想从结果中删除该行的标签。
r - (d)plyr 中的 mutate() 在获取时不会创建新列
我正在将包 dplyr 与 R 一起使用(同样的问题也适用于 plyr)。当我调用source("dply_problem.R")
以下代码时
“C”列未添加到df
. 但是,当我mutate(df, C = A + B)
从 shell 调用时,确实会创建列“C”。你能告诉我为什么会这样吗?
r - Formula evaluation with mutate()
Is there a way to make mutate()
evaluate formulas in (d)plyr package of R? I think of situations where one has many variables like count.a, count.b, ..., count.z
and I would like to create a new variable to sum all these. I can create a character string like "count.total = count.a + count.b + (...) + count.z"
, but how to make mutate()
evaluate it?