问题标签 [tidytable]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
7 回答
5142 浏览

r - 如何在 dplyr 中命名 group_split 输出的列表

我有以下使用dplyr 的 group_split 的过程

结果是:

我想要实现的是按分组名称(即物种)命名这个列表。产生这个(手工完成):

我怎样才能做到这一点?

更新

我尝试了这个新数据,现在命名为Cluster

使用 Ronak Shah 的方法,我得到不一致的结果:

注意里面$Cluster9Cluster1

请建议如何解决这个问题?

0 投票
5 回答
294 浏览

r - tidyverse:将 data.frame 的每一行与另一个 data.frame 的单行进行比较

我想以整齐的方式将每一行df1与单行进行比较。df2请有任何提示。

0 投票
2 回答
53 浏览

r - 用另一个 data.frame 的行更新一个 data.frame 的行

我想data.frame df1用 的行更新 的行data.frame df2。有什么提示吗?

所需输出

0 投票
1 回答
82 浏览

r - 有效绑定不同属性的行

我想绑定行。但是,data.frames 的少数列具有不同的属性。喜欢df1$caseid和具有与和df1$v001 不同的属性。想知道我怎样才能在那里绑定data.frames。df2$caseiddf2$v001

0 投票
3 回答
66 浏览

r - 有条件地重复字符串的某些部分

我想在 和 之间重复字符串的某些部分,]作为由前面;分隔的元素的数量within 。因此,所需的输出将是. 任何开始的提示。谢谢;[][A1, AB11; A2, AB22] I1, C1[A1, AB11] I1, C1; [A2, AB22] I1, C1

0 投票
2 回答
316 浏览

r - tidyverse:使用 str_detect 过滤

我想使用filter命令dplyr以及str_detect.

所需输出

我希望以更有效的方式进行以下输出(因为在我原来的问题中会有很多 MatchText 的未知元素)。

更有效地完成上述任务的任何提示。

0 投票
1 回答
108 浏览

r - 如何根据某些条件优化粘贴单个/多个列名及其值

我想粘贴列名及其值。它必须基于某些条件(if 语句),它可以基于单个变量或多个变量。

下面是一个小例子,展示了数据的样子。我想加快这个过程并获得与 fun2、fun3 和 fun4 相同的结果。

为了使这一点尽可能简单,如果 a、b、c 和 d 列的值大于零,则只有一个规则可以设置为缺失。但是,我留下了规则的名称,因为它可以不同,比如“规则 1”> 0 和“规则 2”如果是非缺失的。

这是数据的样子:

波纹管是所需的输出。这个想法是保留一列,其中包含一些值已设置为缺失的原因的描述。在此示例中,只有前两个人同时拥有 t1 和 t2 的记录。个人 1、2 和 3 有 t1 的记录,而个人 1、2、5、7 和 9 有 t2 的记录。

第一次尝试 (fun1)。不是预期的结果,因为它在 mutate 中查找单个空格。所有其他函数(fun2、fun3 和 fun4)打印正确的结果。

函数 2 (fun2) 使用“trimws”。

函数 3 (fun3) 使用带有正则表达式的“gsub”。

函数 4 (fun4) 在 mutate 中使用 stri_detect 和正则表达式。

使用更多数据进行基准测试

有没有人知道如何加快这个过程?

谢谢你。

0 投票
1 回答
62 浏览

r - 如何在 tidytable 中按行生成列表对象?

我有下want表,它是用rowwise()和生成的mutate()。主要问题是这个解决方案太慢了。

实际数据集包含大约 15,000,000 行,大约需要 6 个小时才能完成。

我希望做的是将rowwise()andmutate()操作转换为 tidytable 以便它可以利用data.table速度。或者也许我只需要一个基本的 R 解决方案?

我尝试按照 https://markfairbanks.github.io/tidytable/reference/mutate_rowwise..html替换rowwise()andmutate()tidytable::mutate_rowwise.()

但我不确定如何解释以下错误

0 投票
1 回答
55 浏览

r - 如何在 R 中有效地存储嵌套数据?

我想在 R 中操作、存储和检索嵌套数据,但令我惊讶的是,嵌套数据框的大小大幅增加:

存在同样的问题tidytable

数据嵌套是一个很酷的想法,因为如果数据不是二维的,它有助于控制数据重复问题。

但是这种内存增加是有问题的。

此外,write_fst如果有嵌套列,则拒绝写入数据,所以我可能也需要一个不同的解决方案。

你有什么建议吗?

0 投票
3 回答
80 浏览

r - 折叠:按行修改列以及组合来自多列的值

我想使用tidytableR将以下代码转换为折叠高级和快速数据转换

整洁的代码

折叠代码

请有任何提示。