问题标签 [tidyverse]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1220 浏览

r - R:找到每个组内和整个数据帧内的相对权重

我的数据框在包含其他两个变量的每一行中都有一个值。

如何找到每个汽车组中每种样式的相对权重,以及每种样式在所有数据中的相对权重?这是所需的输出(不需要右侧的#注释,但为了清楚显示总重量计算,在此处添加):

我在下面的尝试仅成功计算了总重量。如何在同一 dplyr 管道中获得所需的输出:

0 投票
2 回答
81 浏览

r - R:通过为特定元素创建列来重塑数据框(控制处理)

考虑一个数据框,显示对照结果和男性和女性的两种实验处理以及每种处理的大小:

为了并排比较控制与实验治疗,我想重塑数据框如下:

我在下面的尝试有效,但对我来说似乎很麻烦,因为它在将辅助数据框合并到最后一个之前创建了辅助数据框:

可以在一个管道内实现上述目标吗?

0 投票
2 回答
1588 浏览

r - R:通过有小拼写错误的字符列连接两个数据帧

我的两个数据框具有相同的字符列。使用 dplyr::full_joint 在此列中加入它们会很容易。但问题是common 列在拼写上有细微但明显的差异。相对于定义技能的每个字符串,拼写差异很小:

如何在下面实现所需的输出:

我正在考虑根据“技能”列中字符串之间的距离匹配两个数据框中的行,例如使用 stringdist 包。如果两根弦之间的差异很小,则意味着技能相同。

我更喜欢 dplyr/tidyverse 解决方案。

这是数据帧 A 的实际输入:

和数据框B:

这是两个数据框的头:

第二个:

0 投票
2 回答
500 浏览

r - 使用 R 和 dplyr 扩展和离散化时间序列数据

我有一个实验的数据。我们为人类的决策计时。我们有一组备选方案(我们称它们为 A、B、C、D),可以在 30 秒内重复选择,我们对第一个、第二个、第 N 个选择进行计时(受试者可能会改变主意)。数据看起来像这样(以毫秒为单位的时间):

我想离散化和扩展数据,以便能够获得每秒选择的选项;每次没有选择时默认为 0(还)。理想情况下,它看起来像这样

...依此类推,直到秒 = 30。

基于 tidyverse 包和 dplyr 管道的解决方案将是最受欢迎的。但我对其他解决方案持开放态度。谢谢!

0 投票
1 回答
4001 浏览

r - 将具有可变列类型的多个 .csv 文件导入 R

如何正确构建一个 lapply 来读取(从一个目录中)所有 .csv 文件,将所有列加载为字符串,然后将它们绑定到一个数据框中。

根据这个,我有一种方法可以将所有 .csv 文件加载并绑定到数据框中。不幸的是,他们对列的类型转换方式的可变性感到困惑。因此给了我这个错误:

错误:无法自动将列中的字符转换为整数

我尝试用数据类型的参数来补充代码,并试图将所有内容都保留为字符;我现在被困在能够正确地让我的 lapply“循环”有效地引用其“循环”的每个循环的主题上。

是否有一个简单的解决方法可以让我保持在 tidyverse 中,或者我必须降低一个级别并自己公开构建 for 循环 - per this

0 投票
2 回答
709 浏览

r - R中的收集和传播函数

我使用以下代码创建了一个数据框:

我已将收集功能应用到数据框中:

在尝试传播资源时出现错误:

0 投票
1 回答
1014 浏览

r - R对多列组合的分组

将输入dsam视为:

我试图对这些组进行分组ac汇总b,以保持每组一条记录。但似乎以下代码的行为有所不同。原始数据有超过 300 列用于分组,因此不能显式指定列名,因此不能使用列名列表进行分组。

方法一:

方法二:

如何使方法 2 的行为类似于方法 1?

ps 由于用于分组的列数量众多,我不希望将它们连接在一起。谢谢你。

0 投票
1 回答
121 浏览

r - 如何仅保留特定行数以上的组?

所以当你运行这个脚本时,你会得到下面的输出。现在在 cut 和 color 列中只有 3 个组合“Fair D”,这也可以从 rank1 列中看到。另一组“Fair E”有 5 行。我想为超过 3 行的组保留行。

在此处输入图像描述

0 投票
0 回答
106 浏览

r - R:如何计算每个组和所有数据的汇总?

我认为以下任务经常出现:计算每个组和所有数据的摘要,并将结果显示在一个数据框中。例如,对于 iris 数据框,我们可以计算每个 Species 的每一列的平均值:

我们可以计算所有物种每列的平均值,并将唯一的行称为“所有物种”:

最后,通过绑定两个数据帧,我们获得了所需的输出:

我的问题是:所有这些都可以在一个管道中完成(无需创建两个数据框然后绑定它们)吗?

0 投票
1 回答
4058 浏览

r - R Shiny - 如何按 checkboxGroupInput 过滤

我已经设置了以下闪亮代码:

全球.R:

ui.R:

和服务器.R:

大陆是如何被过滤的,这是一个问题。在默认设置下,我们可以看到表格中一共有344个国家。但是如果我取消选中大洋洲,这个数字会上升(?)到 420 个国家。到底是怎么回事?我相当确定这个问题与filter(continent == input$ContinentSelect)server.R 文件中的行有关,但我不知道如何解决它。