问题标签 [tidytable]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何在 dplyr 中命名 group_split 输出的列表
我有以下使用dplyr 的 group_split 的过程:
结果是:
我想要实现的是按分组名称(即物种)命名这个列表。产生这个(手工完成):
我怎样才能做到这一点?
更新
我尝试了这个新数据,现在命名为Cluster
:
使用 Ronak Shah 的方法,我得到不一致的结果:
注意里面$Cluster9
有Cluster1
。
请建议如何解决这个问题?
r - tidyverse:将 data.frame 的每一行与另一个 data.frame 的单行进行比较
我想以整齐的方式将每一行df1
与单行进行比较。df2
请有任何提示。
r - 用另一个 data.frame 的行更新一个 data.frame 的行
我想data.frame
df1
用 的行更新 的行data.frame
df2
。有什么提示吗?
所需输出
r - 有效绑定不同属性的行
我想绑定行。但是,data.frames 的少数列具有不同的属性。喜欢df1$caseid
和具有与和df1$v001
不同的属性。想知道我怎样才能在那里绑定data.frames。df2$caseid
df2$v001
r - 有条件地重复字符串的某些部分
我想在 和 之间重复字符串的某些部分,]
作为由前面;
分隔的元素的数量within 。因此,所需的输出将是. 任何开始的提示。谢谢;
[]
[A1, AB11; A2, AB22] I1, C1
[A1, AB11] I1, C1; [A2, AB22] I1, C1
r - tidyverse:使用 str_detect 过滤
我想使用filter
命令dplyr
以及str_detect
.
所需输出
我希望以更有效的方式进行以下输出(因为在我原来的问题中会有很多 MatchText 的未知元素)。
更有效地完成上述任务的任何提示。
r - 如何根据某些条件优化粘贴单个/多个列名及其值
我想粘贴列名及其值。它必须基于某些条件(if 语句),它可以基于单个变量或多个变量。
下面是一个小例子,展示了数据的样子。我想加快这个过程并获得与 fun2、fun3 和 fun4 相同的结果。
为了使这一点尽可能简单,如果 a、b、c 和 d 列的值大于零,则只有一个规则可以设置为缺失。但是,我留下了规则的名称,因为它可以不同,比如“规则 1”> 0 和“规则 2”如果是非缺失的。
这是数据的样子:
波纹管是所需的输出。这个想法是保留一列,其中包含一些值已设置为缺失的原因的描述。在此示例中,只有前两个人同时拥有 t1 和 t2 的记录。个人 1、2 和 3 有 t1 的记录,而个人 1、2、5、7 和 9 有 t2 的记录。
第一次尝试 (fun1)。不是预期的结果,因为它在 mutate 中查找单个空格。所有其他函数(fun2、fun3 和 fun4)打印正确的结果。
函数 2 (fun2) 使用“trimws”。
函数 3 (fun3) 使用带有正则表达式的“gsub”。
函数 4 (fun4) 在 mutate 中使用 stri_detect 和正则表达式。
使用更多数据进行基准测试
有没有人知道如何加快这个过程?
谢谢你。
r - 如何在 tidytable 中按行生成列表对象?
我有下want
表,它是用rowwise()
和生成的mutate()
。主要问题是这个解决方案太慢了。
实际数据集包含大约 15,000,000 行,大约需要 6 个小时才能完成。
我希望做的是将rowwise()
andmutate()
操作转换为 tidytable 以便它可以利用data.table
速度。或者也许我只需要一个基本的 R 解决方案?
我尝试按照
https://markfairbanks.github.io/tidytable/reference/mutate_rowwise..html替换rowwise()
andmutate()
tidytable::mutate_rowwise.()
但我不确定如何解释以下错误
r - 如何在 R 中有效地存储嵌套数据?
我想在 R 中操作、存储和检索嵌套数据,但令我惊讶的是,嵌套数据框的大小大幅增加:
存在同样的问题tidytable
。
数据嵌套是一个很酷的想法,因为如果数据不是二维的,它有助于控制数据重复问题。
但是这种内存增加是有问题的。
此外,write_fst
如果有嵌套列,则拒绝写入数据,所以我可能也需要一个不同的解决方案。
你有什么建议吗?