问题标签 [tidyverse]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R:找到每个组内和整个数据帧内的相对权重
我的数据框在包含其他两个变量的每一行中都有一个值。
如何找到每个汽车组中每种样式的相对权重,以及每种样式在所有数据中的相对权重?这是所需的输出(不需要右侧的#注释,但为了清楚显示总重量计算,在此处添加):
我在下面的尝试仅成功计算了总重量。如何在同一 dplyr 管道中获得所需的输出:
r - R:通过为特定元素创建列来重塑数据框(控制处理)
考虑一个数据框,显示对照结果和男性和女性的两种实验处理以及每种处理的大小:
为了并排比较控制与实验治疗,我想重塑数据框如下:
我在下面的尝试有效,但对我来说似乎很麻烦,因为它在将辅助数据框合并到最后一个之前创建了辅助数据框:
可以在一个管道内实现上述目标吗?
r - R:通过有小拼写错误的字符列连接两个数据帧
我的两个数据框具有相同的字符列。使用 dplyr::full_joint 在此列中加入它们会很容易。但问题是common 列在拼写上有细微但明显的差异。相对于定义技能的每个字符串,拼写差异很小:
如何在下面实现所需的输出:
我正在考虑根据“技能”列中字符串之间的距离匹配两个数据框中的行,例如使用 stringdist 包。如果两根弦之间的差异很小,则意味着技能相同。
我更喜欢 dplyr/tidyverse 解决方案。
这是数据帧 A 的实际输入:
和数据框B:
这是两个数据框的头:
第二个:
r - 使用 R 和 dplyr 扩展和离散化时间序列数据
我有一个实验的数据。我们为人类的决策计时。我们有一组备选方案(我们称它们为 A、B、C、D),可以在 30 秒内重复选择,我们对第一个、第二个、第 N 个选择进行计时(受试者可能会改变主意)。数据看起来像这样(以毫秒为单位的时间):
我想离散化和扩展数据,以便能够获得每秒选择的选项;每次没有选择时默认为 0(还)。理想情况下,它看起来像这样
...依此类推,直到秒 = 30。
基于 tidyverse 包和 dplyr 管道的解决方案将是最受欢迎的。但我对其他解决方案持开放态度。谢谢!
r - 将具有可变列类型的多个 .csv 文件导入 R
如何正确构建一个 lapply 来读取(从一个目录中)所有 .csv 文件,将所有列加载为字符串,然后将它们绑定到一个数据框中。
根据这个,我有一种方法可以将所有 .csv 文件加载并绑定到数据框中。不幸的是,他们对列的类型转换方式的可变性感到困惑。因此给了我这个错误:
错误:无法自动将列中的字符转换为整数
我尝试用数据类型的参数来补充代码,并试图将所有内容都保留为字符;我现在被困在能够正确地让我的 lapply“循环”有效地引用其“循环”的每个循环的主题上。
是否有一个简单的解决方法可以让我保持在 tidyverse 中,或者我必须降低一个级别并自己公开构建 for 循环 - per this。
r - R中的收集和传播函数
我使用以下代码创建了一个数据框:
我已将收集功能应用到数据框中:
在尝试传播资源时出现错误:
r - R对多列组合的分组
将输入dsam
视为:
我试图对这些组进行分组a
和c
汇总b
,以保持每组一条记录。但似乎以下代码的行为有所不同。原始数据有超过 300 列用于分组,因此不能显式指定列名,因此不能使用列名列表进行分组。
方法一:
方法二:
如何使方法 2 的行为类似于方法 1?
ps 由于用于分组的列数量众多,我不希望将它们连接在一起。谢谢你。
r - R:如何计算每个组和所有数据的汇总?
我认为以下任务经常出现:计算每个组和所有数据的摘要,并将结果显示在一个数据框中。例如,对于 iris 数据框,我们可以计算每个 Species 的每一列的平均值:
我们可以计算所有物种每列的平均值,并将唯一的行称为“所有物种”:
最后,通过绑定两个数据帧,我们获得了所需的输出:
我的问题是:所有这些都可以在一个管道中完成(无需创建两个数据框然后绑定它们)吗?
r - R Shiny - 如何按 checkboxGroupInput 过滤
我已经设置了以下闪亮代码:
全球.R:
ui.R:
和服务器.R:
大陆是如何被过滤的,这是一个问题。在默认设置下,我们可以看到表格中一共有344个国家。但是如果我取消选中大洋洲,这个数字会上升(?)到 420 个国家。到底是怎么回事?我相当确定这个问题与filter(continent == input$ContinentSelect)
server.R 文件中的行有关,但我不知道如何解决它。