问题标签 [tidyr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2493 浏览

r - Tidyr 的带有 NA 的 collect()

我正在使用tidyrandlubridate将宽表转换为长表。以下工作正常。

但是,当混合中有 NA 时,日期将转换为字符串。

请注意,当常规字符串也与 NA 混合时,仍然会出现警告。

是否可以将 tidyr 与 NA 一起使用,同时避免警告并保留格式?

0 投票
2 回答
4178 浏览

r - 使用 tidyr::separate with sep="" 将一列分成多列

我想将列sequence分成 5 列(每个字符一列)。我试图这样做,tidyr::separate但它在内部使用stringi::stri_split_regex不接受空字符串作为分隔符(尽管sep参数应该采用正则表达式)。

预期输出如下所示:

0 投票
1 回答
634 浏览

r - 在 tidyr 中使用正则表达式的问题

使用数据是刚刚在这里提出的一个问题,我想使用tidyrusing传播数据extract()

这是基于 hadley here的回答。

但我得到了错误:

我通常不使用正则表达式,但想开始使用,所以如果有人可以帮助我了解我失败的地方,我将不胜感激。

谢谢!

0 投票
3 回答
17906 浏览

r - 使用 tidyr 收集时保留属性(属性不相同)

我有一个数据框需要分成两个表以满足 Codd 的第三范式。在一个简单的情况下,原始数据框看起来像这样:

当我使用收集功能时,它会警告属性不相同,并且会丢失性别因素和 bday 的 lubridate(或真实示例中的其他属性)。是否有一个很好的 tidyr 解决方案来避免丢失每列的数据类型?

我可以想象一种方法,即分别收集具有相同数据类型的每组变量,然后加入所有表,但必须有一个我缺少的更优雅的解决方案。

0 投票
1 回答
254 浏览

r - 在 R 数据框中将一列分成几列,然后旋转

我有一个以下格式的数据框,有两列。

第一列是名称,第二列是描述,表示层次结构中的级别。即A校和B校同级,Class比学校低一级,所以他们的des更长,在其学校des1@123或1@124之后多了一个@。那么学生……

我想根据他们的 des 将数据重新排列成几列,比如旋转。即不确定我们在 R 中是否有任何相关代码?谢谢。

0 投票
0 回答
82 浏览

r - 与 tidyr 聚集后的意外子集行为

这里发生了什么?

设置

创建y1y2,等价的data.frames。y1使用生成gathery2直接读入。

y1并且y2相等

问题

子集将POSIXcty1列删除为数字,但y2以相同方式进行子集不会。

会话信息

R 版本 3.1.2 (2014-10-31) 平台:i386-w64-mingw32/i386(32 位)

tidyr 0.2.0.9000

0 投票
2 回答
9396 浏览

r - 具有缺失值的 dplyr 交叉表

我想在 R 中使用dplyr. 我有充分的理由不只是使用基本table()命令。

这一切都很好。group_by()但是当变量中存在缺失值时,它似乎分崩离析。

我想我想要的是一个NA专栏,比如当你做的时候table(..., useNA = "always")。有小费吗?

0 投票
1 回答
591 浏览

regex - 在 R 中:tidyr 使用正则表达式将值拆分并摆动到列名中

我试图使用tidyr包进行定制,并且正在努力解决一个变量是多个变量连接的问题。在下面的最小示例中,我想将变量v2拆分为其组成变量v3v4然后摆动这些变量,最终得到四个变量v1- v4

如果我分裂v2成一个新的temp,我只会得到v3

我的问题是:

  • 1)我如何拆分和摆动v3v4向上作为列名使用tidyr
  • 2)在我的真实数据中,我不知道(或者它们很多)变量名称,但它们具有结构“var value”,我想使用一些正则表达式来自动识别和摆动它们,如 1)

受到这个SO 答案的启发,但无法使用变量名的正则表达式代码使其工作。

更新:我的输出将类似于(v2可以跳过,因为它现在与v3and冗余v4):

0 投票
5 回答
1516 浏览

r - 在R中将多行转换为单列

使用 R,我有一个大数据框,以下是一个示例:

看起来像:

由于缺少数据,有时可能有 6 个观测值,但对于其他天可能只有 4 个(或更少,这是一个示例)。

我想将其转换为一个数据框,其中日期为每 30 分钟间隔的单独列,例如:

df我可以轻松获取X2 所在位置的索引,NA然后编写一个for将日期向前推进的循环,但我想避免forR 中的循环。

我怎样才能在 R 中做到这一点?当然可以使用dplyrortidyr解决方案,但我无法从文档中的示例中生成一个。或者也许某个版本的melt?

0 投票
2 回答
311 浏览

r - R:使用tidyr清理结构缺失和冗余数据的数据表

仍然试图让我的手得到tidyr包裹。如果一个数据集包含这样的冗余行:

由于 id 变量v1-v3被拆分为具有许多 NA 的冗余行(因此这两个测量值也被重复),因此人们希望得到如下所示的内容:

使用它的一般方法是tidyr什么?我觉得可以使用gather()但如何完成?