问题标签 [tidyr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Tidyr 的带有 NA 的 collect()
我正在使用tidyr
andlubridate
将宽表转换为长表。以下工作正常。
但是,当混合中有 NA 时,日期将转换为字符串。
请注意,当常规字符串也与 NA 混合时,仍然会出现警告。
是否可以将 tidyr 与 NA 一起使用,同时避免警告并保留格式?
r - 使用 tidyr::separate with sep="" 将一列分成多列
我想将列sequence
分成 5 列(每个字符一列)。我试图这样做,tidyr::separate
但它在内部使用stringi::stri_split_regex
不接受空字符串作为分隔符(尽管sep
参数应该采用正则表达式)。
预期输出如下所示:
r - 使用 tidyr 收集时保留属性(属性不相同)
我有一个数据框需要分成两个表以满足 Codd 的第三范式。在一个简单的情况下,原始数据框看起来像这样:
当我使用收集功能时,它会警告属性不相同,并且会丢失性别因素和 bday 的 lubridate(或真实示例中的其他属性)。是否有一个很好的 tidyr 解决方案来避免丢失每列的数据类型?
我可以想象一种方法,即分别收集具有相同数据类型的每组变量,然后加入所有表,但必须有一个我缺少的更优雅的解决方案。
r - 在 R 数据框中将一列分成几列,然后旋转
我有一个以下格式的数据框,有两列。
第一列是名称,第二列是描述,表示层次结构中的级别。即A校和B校同级,Class比学校低一级,所以他们的des更长,在其学校des1@123或1@124之后多了一个@。那么学生……
我想根据他们的 des 将数据重新排列成几列,比如旋转。即不确定我们在 R 中是否有任何相关代码?谢谢。
r - 与 tidyr 聚集后的意外子集行为
这里发生了什么?
设置
创建y1
和y2
,等价的data.frames。y1
使用生成gather
并y2
直接读入。
y1
并且y2
相等
问题
子集将POSIXcty1
列删除为数字,但y2
以相同方式进行子集不会。
会话信息
R 版本 3.1.2 (2014-10-31) 平台:i386-w64-mingw32/i386(32 位)
tidyr 0.2.0.9000
r - 具有缺失值的 dplyr 交叉表
我想在 R 中使用dplyr
. 我有充分的理由不只是使用基本table()
命令。
这一切都很好。group_by()
但是当变量中存在缺失值时,它似乎分崩离析。
我想我想要的是一个NA
专栏,比如当你做的时候table(..., useNA = "always")
。有小费吗?
regex - 在 R 中:tidyr 使用正则表达式将值拆分并摆动到列名中
我试图使用tidyr
包进行定制,并且正在努力解决一个变量是多个变量连接的问题。在下面的最小示例中,我想将变量v2
拆分为其组成变量v3
,v4
然后摆动这些变量,最终得到四个变量v1
- v4
。
如果我分裂v2
成一个新的temp
,我只会得到v3
:
我的问题是:
- 1)我如何拆分和摆动
v3
和v4
向上作为列名使用tidyr
? - 2)在我的真实数据中,我不知道(或者它们很多)变量名称,但它们具有结构“var value”,我想使用一些正则表达式来自动识别和摆动它们,如 1)
受到这个SO 答案的启发,但无法使用变量名的正则表达式代码使其工作。
更新:我的输出将类似于(v2
可以跳过,因为它现在与v3
and冗余v4
):
r - 在R中将多行转换为单列
使用 R,我有一个大数据框,以下是一个示例:
看起来像:
由于缺少数据,有时可能有 6 个观测值,但对于其他天可能只有 4 个(或更少,这是一个示例)。
我想将其转换为一个数据框,其中日期为每 30 分钟间隔的单独列,例如:
df
我可以轻松获取X2 所在位置的索引,NA
然后编写一个for
将日期向前推进的循环,但我想避免for
R 中的循环。
我怎样才能在 R 中做到这一点?当然可以使用dplyr
ortidyr
解决方案,但我无法从文档中的示例中生成一个。或者也许某个版本的melt
?
r - R:使用tidyr清理结构缺失和冗余数据的数据表
仍然试图让我的手得到tidyr
包裹。如果一个数据集包含这样的冗余行:
由于 id 变量v1
-v3
被拆分为具有许多 NA 的冗余行(因此这两个测量值也被重复),因此人们希望得到如下所示的内容:
使用它的一般方法是tidyr
什么?我觉得可以使用gather()
但如何完成?