问题标签 [tidyverse]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

7703 问题

0 投票

1 回答

1220 浏览

r - R：找到每个组内和整个数据帧内的相对权重

我的数据框在包含其他两个变量的每一行中都有一个值。

如何找到每个汽车组中每种样式的相对权重，以及每种样式在所有数据中的相对权重？这是所需的输出（不需要右侧的#注释，但为了清楚显示总重量计算，在此处添加）：

我在下面的尝试仅成功计算了总重量。如何在同一 dplyr 管道中获得所需的输出：

r dplyr frequency tidyverse

2016-11-01T03:14:18.747

0 投票

2 回答

81 浏览

r - R：通过为特定元素创建列来重塑数据框（控制处理）

考虑一个数据框，显示对照结果和男性和女性的两种实验处理以及每种处理的大小：

为了并排比较控制与实验治疗，我想重塑数据框如下：

我在下面的尝试有效，但对我来说似乎很麻烦，因为它在将辅助数据框合并到最后一个之前创建了辅助数据框：

可以在一个管道内实现上述目标吗？

r pipe dplyr tidyverse

2016-11-01T22:09:48.657

0 投票

2 回答

1588 浏览

r - R：通过有小拼写错误的字符列连接两个数据帧

我的两个数据框具有相同的字符列。使用 dplyr::full_joint 在此列中加入它们会很容易。但问题是common 列在拼写上有细微但明显的差异。相对于定义技能的每个字符串，拼写差异很小：

如何在下面实现所需的输出：

我正在考虑根据“技能”列中字符串之间的距离匹配两个数据框中的行，例如使用 stringdist 包。如果两根弦之间的差异很小，则意味着技能相同。

我更喜欢 dplyr/tidyverse 解决方案。

这是数据帧 A 的实际输入：

和数据框B：

这是两个数据框的头：

第二个：

r dataframe dplyr tidyverse

2016-11-14T00:15:37.447

0 投票

2 回答

500 浏览

r - 使用 R 和 dplyr 扩展和离散化时间序列数据

我有一个实验的数据。我们为人类的决策计时。我们有一组备选方案（我们称它们为 A、B、C、D），可以在 30 秒内重复选择，我们对第一个、第二个、第 N 个选择进行计时（受试者可能会改变主意）。数据看起来像这样（以毫秒为单位的时间）：

我想离散化和扩展数据，以便能够获得每秒选择的选项；每次没有选择时默认为 0（还）。理想情况下，它看起来像这样

...依此类推，直到秒 = 30。

基于 tidyverse 包和 dplyr 管道的解决方案将是最受欢迎的。但我对其他解决方案持开放态度。谢谢！

r time-series dplyr tidyverse

2016-11-16T10:45:29.173

0 投票

1 回答

4001 浏览

r - 将具有可变列类型的多个 .csv 文件导入 R

如何正确构建一个 lapply 来读取（从一个目录中）所有 .csv 文件，将所有列加载为字符串，然后将它们绑定到一个数据框中。

根据这个，我有一种方法可以将所有 .csv 文件加载并绑定到数据框中。不幸的是，他们对列的类型转换方式的可变性感到困惑。因此给了我这个错误：

错误：无法自动将列中的字符转换为整数

我尝试用数据类型的参数来补充代码，并试图将所有内容都保留为字符；我现在被困在能够正确地让我的 lapply“循环”有效地引用其“循环”的每个循环的主题上。

是否有一个简单的解决方法可以让我保持在 tidyverse 中，或者我必须降低一个级别并自己公开构建 for 循环 - per this。

r dplyr tidyverse

2016-11-16T18:57:08.557

0 投票

2 回答

709 浏览

r - R中的收集和传播函数

我使用以下代码创建了一个数据框：

我已将收集功能应用到数据框中：

在尝试传播资源时出现错误：

r tidyverse

2016-11-17T15:01:00.993

0 投票

1 回答

1014 浏览

r - R对多列组合的分组

将输入dsam视为：

我试图对这些组进行分组a和c汇总b，以保持每组一条记录。但似乎以下代码的行为有所不同。原始数据有超过 300 列用于分组，因此不能显式指定列名，因此不能使用列名列表进行分组。

方法一：

方法二：

如何使方法 2 的行为类似于方法 1？

ps 由于用于分组的列数量众多，我不希望将它们连接在一起。谢谢你。

r dplyr tidyverse

2016-11-18T10:50:51.333

0 投票

1 回答

121 浏览

r - 如何仅保留特定行数以上的组？

所以当你运行这个脚本时，你会得到下面的输出。现在在 cut 和 color 列中只有 3 个组合“Fair D”，这也可以从 rank1 列中看到。另一组“Fair E”有 5 行。我想为超过 3 行的组保留行。

r tidyverse

2016-11-21T10:39:38.437

0 投票

0 回答

106 浏览

r - R：如何计算每个组和所有数据的汇总？

我认为以下任务经常出现：计算每个组和所有数据的摘要，并将结果显示在一个数据框中。例如，对于 iris 数据框，我们可以计算每个 Species 的每一列的平均值：

我们可以计算所有物种每列的平均值，并将唯一的行称为“所有物种”：

最后，通过绑定两个数据帧，我们获得了所需的输出：

我的问题是：所有这些都可以在一个管道中完成（无需创建两个数据框然后绑定它们）吗？

r dataframe dplyr tidyverse

2016-11-23T03:20:48.153

0 投票

1 回答

4058 浏览

r - R Shiny - 如何按 checkboxGroupInput 过滤

我已经设置了以下闪亮代码：

全球.R：

ui.R:

和服务器.R：

大陆是如何被过滤的，这是一个问题。在默认设置下，我们可以看到表格中一共有344个国家。但是如果我取消选中大洋洲，这个数字会上升（？）到 420 个国家。到底是怎么回事？我相当确定这个问题与filter(continent == input$ContinentSelect)server.R 文件中的行有关，但我不知道如何解决它。

r shiny tidyverse

2016-11-24T15:39:34.230

1 2 3 4 5 6 7 8 9 10

问题标签 [tidyverse]

Reference