问题标签 [tidytable]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

11 问题

0 投票

7 回答

5142 浏览

r - 如何在 dplyr 中命名 group_split 输出的列表

我有以下使用dplyr 的 group_split 的过程：

结果是：

我想要实现的是按分组名称（即物种）命名这个列表。产生这个（手工完成）：

我怎样才能做到这一点？

更新

我尝试了这个新数据，现在命名为Cluster：

使用 Ronak Shah 的方法，我得到不一致的结果：

注意里面$Cluster9有Cluster1。

请建议如何解决这个问题？

r dplyr split tidyverse tidytable

2019-07-19T07:38:19.363

0 投票

5 回答

294 浏览

r - tidyverse：将 data.frame 的每一行与另一个 data.frame 的单行进行比较

我想以整齐的方式将每一行df1与单行进行比较。df2请有任何提示。

r tidyverse tidytable

2020-06-18T18:19:20.597

0 投票

2 回答

53 浏览

r - 用另一个 data.frame 的行更新一个 data.frame 的行

我想data.frame df1用的行更新的行data.frame df2。有什么提示吗？

所需输出

r tidyverse tidytable

2020-07-20T15:30:56.037

0 投票

1 回答

82 浏览

r - 有效绑定不同属性的行

我想绑定行。但是，data.frames 的少数列具有不同的属性。喜欢df1$caseid和具有与和df1$v001 不同的属性。想知道我怎样才能在那里绑定data.frames。df2$caseiddf2$v001

r tidyverse tidytable

2020-08-07T11:18:17.517

0 投票

3 回答

66 浏览

r - 有条件地重复字符串的某些部分

我想在和之间重复字符串的某些部分，]作为由前面;分隔的元素的数量within 。因此，所需的输出将是. 任何开始的提示。谢谢;[][A1, AB11; A2, AB22] I1, C1[A1, AB11] I1, C1; [A2, AB22] I1, C1

r dplyr tidyverse stringr tidytable

2020-11-24T18:57:06.427

0 投票

2 回答

316 浏览

r - tidyverse：使用 str_detect 过滤

我想使用filter命令dplyr以及str_detect.

所需输出

我希望以更有效的方式进行以下输出（因为在我原来的问题中会有很多 MatchText 的未知元素）。

更有效地完成上述任务的任何提示。

r dplyr tidyverse stringr tidytable

2020-12-07T13:11:35.397

0 投票

1 回答

108 浏览

r - 如何根据某些条件优化粘贴单个/多个列名及其值

我想粘贴列名及其值。它必须基于某些条件（if 语句），它可以基于单个变量或多个变量。

下面是一个小例子，展示了数据的样子。我想加快这个过程并获得与 fun2、fun3 和 fun4 相同的结果。

为了使这一点尽可能简单，如果 a、b、c 和 d 列的值大于零，则只有一个规则可以设置为缺失。但是，我留下了规则的名称，因为它可以不同，比如“规则 1”> 0 和“规则 2”如果是非缺失的。

这是数据的样子：

波纹管是所需的输出。这个想法是保留一列，其中包含一些值已设置为缺失的原因的描述。在此示例中，只有前两个人同时拥有 t1 和 t2 的记录。个人 1、2 和 3 有 t1 的记录，而个人 1、2、5、7 和 9 有 t2 的记录。

第一次尝试 (fun1)。不是预期的结果，因为它在 mutate 中查找单个空格。所有其他函数（fun2、fun3 和 fun4）打印正确的结果。

函数 2 (fun2) 使用“trimws”。

函数 3 (fun3) 使用带有正则表达式的“gsub”。

函数 4 (fun4) 在 mutate 中使用 stri_detect 和正则表达式。

使用更多数据进行基准测试

有没有人知道如何加快这个过程？

谢谢你。

r dplyr data.table tidyverse tidytable

2021-02-05T18:47:02.360

0 投票

1 回答

62 浏览

r - 如何在 tidytable 中按行生成列表对象？

我有下want表，它是用rowwise()和生成的mutate()。主要问题是这个解决方案太慢了。

实际数据集包含大约 15,000,000 行，大约需要 6 个小时才能完成。

我希望做的是将rowwise()andmutate()操作转换为 tidytable 以便它可以利用data.table速度。或者也许我只需要一个基本的 R 解决方案？

我尝试按照 https://markfairbanks.github.io/tidytable/reference/mutate_rowwise..html替换rowwise()andmutate()tidytable::mutate_rowwise.()

但我不确定如何解释以下错误

r dplyr datatable tidytable

2021-05-28T17:52:15.803

0 投票

1 回答

55 浏览

r - 如何在 R 中有效地存储嵌套数据？

我想在 R 中操作、存储和检索嵌套数据，但令我惊讶的是，嵌套数据框的大小大幅增加：

存在同样的问题tidytable。

数据嵌套是一个很酷的想法，因为如果数据不是二维的，它有助于控制数据重复问题。

但是这种内存增加是有问题的。

此外，write_fst如果有嵌套列，则拒绝写入数据，所以我可能也需要一个不同的解决方案。

你有什么建议吗？

r dplyr memory-management nested tidytable

2022-01-27T12:46:40.970

0 投票

3 回答

80 浏览

r - 折叠：按行修改列以及组合来自多列的值

我想使用tidytableR将以下代码转换为折叠：高级和快速数据转换。

整洁的代码

折叠代码

请有任何提示。

r data.table tidyverse collapse tidytable

2022-02-03T18:52:16.180

1 2 3 4 5 6 7 8 9 10