问题标签 [across]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 使用 dplyr 替换来自不同数据帧的多列
我有两个数据框,其中一个包含 ID 的子集和另一个的列(但具有不同的值)。
我希望在 d1 上使用 dplyr 来查找共享列,并将它们的值替换为在 d2 中找到的值,匹配 ID。我可以像这样一次改变它们:
然而,在我的实际情况下,我需要这样做 47 次。有了 的健壮性across()
,我觉得还有更好的办法。我也对非 dplyr 解决方案持开放态度。
r - 理解 R 中的警告信息
这个问题是为了加深对 R 函数 Across & Which 的理解。我运行了这段代码并得到了消息。我想了解
a) 好的和坏的做法有什么区别
b) where 函数在一般情况下和在这个用例中是如何工作的
r - 我如何优雅地跨多个列进行 str_detect 并有条件地填充新列
如您所见,我正在处理一些严重的脏数据。这段代码有效,但看起来有点笨拙。有没有一种更高效、更动态的方式来实现最终结果而无需那么多编码?
我必须分阶段执行此操作,首先标记内容类型,然后利用内容类型将它们填充到相应的列类型中。
感谢你的帮助
数据看起来像这样
我做了这样的事情来让它成形
只需要这个有组织的输出。
谢谢!
r - 如何跨多个列应用 ifelse 函数并在 R 中创建新列
我想在我的数据集的多个列中应用 ifelse 函数并创建新的“重新评分”列。这是一个示例数据集:
我想在所有以 C 开头的行中应用这样的函数:
我的真实数据集有 50 行或更多行需要应用此函数。有没有一种简单的方法可以做到这一点?我已经尝试在 dplyr 中使用“across”的变体,如下所示,但没有成功。我敢肯定还有一个“应用”选项。
r - R:在多列上转换变量
我想一次转换大型 data.frame 中的多个列across
。
作为一个例子,我想做这个转换
但对于所有以“Sepal”开头的列。
我想,我可以使用这个命令,但我不知道如何添加我的功能。
对不起,如果它太琐碎了,但我不知道我必须进入谷歌才能找到一些有用的页面。
r - 如何在 dplyr::across 的 .names 参数中使用字符串操作函数
虽然我试图搜索它是否重复,但我找不到类似的问题。(虽然有一个类似的,但这与我的要求有些不同)
我的问题是,我们是否可以使用字符串操作函数substr
或stringr::str_remove
内部.names
参数dplyr::across
。作为一个可重复的例子,考虑这个
现在我的问题是我想重命名输出列str_remove(.col, 'Sepal')
,这样我的输出列名就是Length.mean
and Width.mean
。为什么我要问,因为,这个论点的描述表明
.names
描述如何命名输出列的粘合规范。这可以使用 {.col} 代表选定的列名,使用 {.fn} 代表正在应用的函数的名称。对于单函数情况,默认值 (NULL) 等效于“{.col}”,对于 .fns 使用列表的情况,默认值 (NULL) 等效于“{.col}_{.fn}”。
我尝试了很多可能性,包括以下,但这些都不起作用
我知道这可以通过添加另一个步骤来解决,rename_with
所以我不关心那个答案。
r - 多个变量的汇总统计数据,统计数据作为行,变量作为列?
我正在尝试使用 dplyr::summarize() 和 dplyr::across() 来获得一个小标题,其中包含行中的几个汇总统计信息和列中的变量。我只能通过使用 dplyr::bind_rows() 来实现这个结果,但我想知道是否有更优雅的方式来获得相同的输出。
为什么不能直接用summary来做呢?正如colwise vignette所建议的那样,似乎比使用函数列表更优雅。这是否违反了整洁数据框的原则?(在我看来,将一堆数据帧一个接一个地放样远不那么整洁。)
r - 使用 tidyverse 过滤包含 R 中数据的列的数据框
我正在尝试编写一行简单的代码来检测数据框中的哪些条目不正确。考虑以下示例:
一行总是需要填写作者,但这有时会被遗忘。此外,有时第 2 行填写了作者,但意外的是其余数据输入到了第 3 行。
我想要的是过滤具有NA
作者的行,然后过滤任何列中的任何数据条目。因此,我对上述示例的预期输出将是:
为作者过滤带有 NA 的行很容易,但我不知道下一步该做什么。到目前为止我的代码:
我觉得我已经很接近了,但是经过几个小时的尝试和查看堆栈后,我的代码仍然向我返回空数据帧。我更喜欢 tidyverse 语法的解决方案,但非常感谢任何帮助。
r - 查看矢量化对以返回匹配值
与我在这里提出的问题相关:查找日期是否在多对矢量化日期之间重叠
初始数据示例:
我的数据是这样排列的,因此每个person
和 a都有行start_date
,还有start_loc
. 我想知道哪些人有
end_date
的 7 天内start_date
,- 并且如果有两对或更多对符合此条件,则优先考虑
end_loc
匹配的那些start_loc
- 否则最早。
所以所需的输出看起来像:
我从上一个问题中遵循了一些技术,例如 using ,c_across
但我似乎无法让 R 带回单个输出。这可能吗?我是否需要再次长期结构化数据?across
rowwise
r - 以使用 mutate、cross 和 case_when 为条件将列名连接在一列中
我想:
- 使用
across
andcase_when
检查列 A1-A3 == 1 - 连接 A1-A3 == 1 和
- 用连接的列名改变一个新列
我的数据框:
期望的输出:
到目前为止,我已经尝试过:
不工作输出:
我想学什么:
- 是否可以用于
across
检查多个列的条件 - 如果是的话,如何查看 ~ of 之后的部分
case_when
以获取特定的列名 - 使用后如何只获得一列
mutate
,across
而case_when
不是像这里的 3。
我以为我已经能够掌握这个任务,但不知怎的,我失去了它......