问题标签 [tidyr]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

3462 问题

0 投票

1 回答

2493 浏览

r - Tidyr 的带有 NA 的 collect()

我正在使用tidyrandlubridate将宽表转换为长表。以下工作正常。

但是，当混合中有 NA 时，日期将转换为字符串。

请注意，当常规字符串也与 NA 混合时，仍然会出现警告。

是否可以将 tidyr 与 NA 一起使用，同时避免警告并保留格式？

r lubridate tidyr

2015-03-10T01:11:02.143

0 投票

2 回答

4178 浏览

r - 使用 tidyr::separate with sep="" 将一列分成多列

我想将列sequence分成 5 列（每个字符一列）。我试图这样做，tidyr::separate但它在内部使用stringi::stri_split_regex不接受空字符串作为分隔符（尽管sep参数应该采用正则表达式）。

预期输出如下所示：

r tidyr

2015-03-10T04:36:47.657

0 投票

1 回答

634 浏览

r - 在 tidyr 中使用正则表达式的问题

使用数据是刚刚在这里提出的一个问题，我想使用tidyrusing传播数据extract()。

这是基于 hadley here的回答。

但我得到了错误：

我通常不使用正则表达式，但想开始使用，所以如果有人可以帮助我了解我失败的地方，我将不胜感激。

谢谢！

r tidyr

2015-03-10T12:34:54.350

0 投票

3 回答

17906 浏览

r - 使用 tidyr 收集时保留属性（属性不相同）

我有一个数据框需要分成两个表以满足 Codd 的第三范式。在一个简单的情况下，原始数据框看起来像这样：

当我使用收集功能时，它会警告属性不相同，并且会丢失性别因素和 bday 的 lubridate（或真实示例中的其他属性）。是否有一个很好的 tidyr 解决方案来避免丢失每列的数据类型？

我可以想象一种方法，即分别收集具有相同数据类型的每组变量，然后加入所有表，但必须有一个我缺少的更优雅的解决方案。

r tidyr

2015-03-10T19:25:01.813

0 投票

1 回答

254 浏览

r - 在 R 数据框中将一列分成几列，然后旋转

我有一个以下格式的数据框，有两列。

第一列是名称，第二列是描述，表示层次结构中的级别。即A校和B校同级，Class比学校低一级，所以他们的des更长，在其学校des1@123或1@124之后多了一个@。那么学生……

我想根据他们的 des 将数据重新排列成几列，比如旋转。即不确定我们在 R 中是否有任何相关代码？谢谢。

r pivot tidyr

2015-03-11T15:32:14.167

0 投票

0 回答

82 浏览

r - 与 tidyr 聚集后的意外子集行为

这里发生了什么？

设置

创建y1和y2，等价的data.frames。y1使用生成gather并y2直接读入。

y1并且y2相等

问题

子集将POSIXcty1列删除为数字，但y2以相同方式进行子集不会。

会话信息

R 版本 3.1.2 (2014-10-31) 平台：i386-w64-mingw32/i386（32 位）

tidyr 0.2.0.9000

r tidyr

2015-03-13T15:34:01.190

0 投票

2 回答

9396 浏览

r - 具有缺失值的 dplyr 交叉表

我想在 R 中使用dplyr. 我有充分的理由不只是使用基本table()命令。

这一切都很好。group_by()但是当变量中存在缺失值时，它似乎分崩离析。

我想我想要的是一个NA专栏，比如当你做的时候table(..., useNA = "always")。有小费吗？

r dplyr tidyr

2015-03-17T19:52:11.253

0 投票

1 回答

591 浏览

regex - 在 R 中：tidyr 使用正则表达式将值拆分并摆动到列名中

我试图使用tidyr包进行定制，并且正在努力解决一个变量是多个变量连接的问题。在下面的最小示例中，我想将变量v2拆分为其组成变量v3，v4然后摆动这些变量，最终得到四个变量v1- v4。

如果我分裂v2成一个新的temp，我只会得到v3：

我的问题是：

1）我如何拆分和摆动v3和v4向上作为列名使用tidyr？
2）在我的真实数据中，我不知道（或者它们很多）变量名称，但它们具有结构“var value”，我想使用一些正则表达式来自动识别和摆动它们，如 1）

受到这个SO 答案的启发，但无法使用变量名的正则表达式代码使其工作。

更新：我的输出将类似于（v2可以跳过，因为它现在与v3and冗余v4）：

regex r tidyr

2015-03-18T11:26:28.507

0 投票

5 回答

1516 浏览

r - 在R中将多行转换为单列

使用 R，我有一个大数据框，以下是一个示例：

看起来像：

由于缺少数据，有时可能有 6 个观测值，但对于其他天可能只有 4 个（或更少，这是一个示例）。

我想将其转换为一个数据框，其中日期为每 30 分钟间隔的单独列，例如：

df我可以轻松获取X2 所在位置的索引，NA然后编写一个for将日期向前推进的循环，但我想避免forR 中的循环。

我怎样才能在 R 中做到这一点？当然可以使用dplyrortidyr解决方案，但我无法从文档中的示例中生成一个。或者也许某个版本的melt?

r dplyr melt tidyr

2015-03-18T18:57:51.620

0 投票

2 回答

311 浏览

r - R：使用tidyr清理结构缺失和冗余数据的数据表

仍然试图让我的手得到tidyr包裹。如果一个数据集包含这样的冗余行：

由于 id 变量v1-v3被拆分为具有许多 NA 的冗余行（因此这两个测量值也被重复），因此人们希望得到如下所示的内容：

使用它的一般方法是tidyr什么？我觉得可以使用gather()但如何完成？

r tidyr

2015-03-18T23:28:21.603

1 2 3 4 5 6 7 8 9 10

问题标签 [tidyr]

Reference