问题标签 [tidyverse]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 使用 dplyr/plyr 计算跨行的百分比?
我有一个数据框 x,像这样。
我希望能够使用 dplyr 或其他 tidyverse 包计算每一行的百分比。有任何想法吗?
例如,x 的输出将是:
感谢您抽出宝贵的时间。
r - R:运行 purr 包中 reduce() 的示例代码时出错
我正在寻找使用 reduce() 将数据帧中的可变数量的列成对连接起来。看起来 reduce() 可以完成这项工作,所以我尝试了一些示例代码并得到了这个错误。我正在使用 RStudio,版本 1.0.136
PS这是我的第一个问题,所以我试图在太多信息方面犯错。如果我需要提供不同/更多/更少的信息,请告诉我。
r - 使用因子/字符级别输入模拟拟合模型中的绘图/数据
我的数据如下所示:
我可以对数据建立线性回归:
并预测产品“A”和“B”的销售额:
但我想模拟拟合模型的绘制,而不是仅仅预测拟合值。我想要绘制,以便我可以捕捉点估计周围的不确定性(无需使用 SD、CI 等)。
我通常会使用simulate()
和更改model_object$fitted.values
. 但我不能这样做,因为我的模型的输入是因子/字符级别(“A”和“B”)。
我可以得到分布的形状:
并模拟这样的绘制:
并将其全部塞入一个小标题中以进行可视化:
但这个过程似乎超级笨拙。如果我的数据增长到 5 个输入变量,每个变量有 10 个因子水平,则不会扩展。那么,我怎样才能使这个通用化呢?
我宁愿留在基地 R 和/或tidyverse
. 是的,我知道我在这里与贝叶斯统计调情,我也许可以使用 Stan 从后验中提取……但这不是重点。
r - 如何在 mutate_at() 中使用 approx()?
我在让 approx() 在 mutate_at() 内部工作时遇到问题。我确实设法使用很长的 mutate() 函数获得了我想要的东西,但为了将来的参考,我想知道是否有更优雅和更少复制粘贴的 mutate_at() 方法来做到这一点。
首要问题是将具有 1 年间隔数据的数据集合并到具有 3 年间隔的数据集,并在数据集中以 3 年间隔插入没有数据的年份。年份之间存在缺失值,而一年需要某种形式的外推。
这很好用。但是我已经尝试了所有这些 mutate_at() 变体并且没有让它们工作。我确信某处的语法有错误......
我什至尝试过 na.approx(),但也无济于事......
我从以下相关问题构建了这些不同的试验:
谢谢你的帮助!
r - 将带有列表列的小标题保存到磁盘
我想将tibble
具有列表列的磁盘保存到磁盘中(仅供稍后在 R 中使用)。理想情况下,我想要一个快速的二进制格式feather
,但是,它似乎不支持列表列:
writeFeather(x, path) 中的错误:未实现:a 是一个列表
我期待readr
包中的方法能够处理这个问题,但我尝试过的方法似乎都没有。
我该怎么做呢?
r - 使用 tidyverse 和 purrr 进行双重嵌套
我想创建一个双嵌套数据结构,其中 c 嵌套在 a 中,a 进一步嵌套在 id 中。
所以第一窝就OK了。但我想进一步嵌套在 m2$one 中。
知道我该怎么做吗?
我可以去:
但这在 m3 中给出了另一列,而不是在 m2$one 中。
r - 为 glm 使用 modelr::add_predictions
我正在尝试使用 tidyverse 和 modelr 包计算一组数据的逻辑回归预测。显然我做错了什么,add_predictions
因为我没有收到逻辑函数的“响应”,就像我在统计中使用“预测”函数一样。这应该很简单,但我无法弄清楚,多次搜索收效甚微。
r - 使用 R 和 lubridate 生成时间序列
tidyverse
有没有一种有效的方法可以用和生成时间序列向量lubridate
?seq()
我知道当一个使用日期数作为间隔时,两者可以一起使用。例如,输入:
可以得到一系列间隔 60 天的日期
但是,有什么方法可以使这也可以工作数周、数月和数年?也许类似于下面的代码,我认为它可以工作但没有:
错误:不兼容的持续时间类(持续时间,数字)。请用
as.duration
.
我知道可以更改dyears(1)
为365
或者30
只需要一年或一个月的近似值,但想知道是否有更聪明的方法来考虑闰年和月。
为了提供更多上下文,我想生成一个日期向量,以便可以自定义scale_x_date
in ggplot
。我不想让waiver()
显示 2000、2003、2006、2009 年,而是希望情节有所有单独的年份,如果可能的话,甚至每三个月的时间段。
r - 通过 r 中的列表列表将数据框转换为描述性文本
我承认这是一个糟糕的问题标题,但我想不出合适的标题,因为我不太确定我在这里尝试做什么:
我有一个看起来像这样的数据框:
我想将其转换为一些文本(用于leaflet
地图弹出窗口),它通过以下方式减少数据:
位置 A
组织 1
项目一;项目b
组织 2
项目c
位置 B
组织 2
项目d
组织 3
项目e;项目 f
ETC
我一直在玩制作列表和 for 循环,但正在努力使用正确的语法。我认为我应该做的是创建一个列表列表,例如:
等等,给:
等,但我想以编程方式执行此操作,然后在创建文本时访问这些元素。我试图在“tidyverse”方法中做到这一点,并使用创建了一个嵌套数据框
给:
以及更典型的基于列表的方法:
给:
但显然这些只是完成了一半的工作(我还没有引入project
变量)并且需要转换为下一阶段的字符串。
非常感谢所有帮助,特别是如果保持在一个tidyverse
方法内
r - 为什么在 dplyr 中为数据框重新分配新名称会使其更快?
我对 dplyr 和 data.table 在我的 data.frame 上创建一个新变量并决定比较方法所花费的时间不满意。
令我惊讶的是,将 dplyr::mutate() 的结果重新分配给新的 data.frame 似乎比不这样做要快。
为什么会这样?