问题标签 [recode]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 从单独的代码表重新编码
我有一个如下数据集:
列Age
、Align
和的属性Weat
在代码数据框中进行了描述:
我想匹配代码数据框以获取我的数据集,如下所示:
我目前正在使用以下代码来完成我的任务,这对于具有 500 列和这些列的代码表的大型数据集来说效率不高。
r - 在 R 中重新编码特定日期
我想将数据集中的所有日期 2006-04-11 更改为 2006-04-01。我将日期变量转换为因子,将 2006-04-11 重新编码为 2006-04-01,然后将变量重新转换回 class = date。
重新编码在变量是一个因素时有效(所有 2006-04-11 日期都更改为 2006-04-01),但在转换回 class = date 后,变量再次显示为 2006-04-11。
将日期变量转换为因子并检查它是否有效。
将因子变量重新编码为我想要的日期(2006-04-01)并查看数据。
将变量从因子转换回日期,检查类并查看数据。
或者,我愿意完全放弃所有日期的日期部分,但我还没有弄清楚如何做到这一点。
r - 在 dplyr 中从字符重新编码为因子中的数字
我recode
从dplyr
V0.5 开始熟悉。我错过了什么吗?似乎Recode
fromcar
更有效。除非我做错了什么:
这有效:
但不是当你有一个因素:
似乎您必须将其视为字符并使用 recode_factor 以便它返回因子
那行得通,但看起来很冗长???Recode
fromcar
会简单地做到这一点:
我错过了什么?
谢谢
r - “未替换的值被视为 NA 作为 .x 不兼容”:重新编码数值变量
我有一个数值变量(V110),取值在 1-4 之间。由于数字代表对政府的较高 (1) 和较低 (4) 信任,我想对它们进行重新编码,以便最高值表示最高值,最低值表示最低信任度。现在我尝试了以下语法:
但是 R 不断输出一条错误消息:
警告消息:视为 NA 的未替换值不兼容。请详细指定替换或提供 .default
我检查了各个答案,即给出的值,其中一些说-2(即一个不属于“1-4”部分的值,这可能是问题吗?我尝试添加两个“.default = NA”或语法末尾的“else = NA”,但这不会使错误消失。有什么帮助吗?
r - 将月份“因子”分类为 data.frame 中的时间段
更新(下面的初始问题)
感谢@akrun和@ulfelder ,我意识到我最初的例子还不够复杂,因为我只有一年的时间。涵盖几年的数据可能更现实,对其他人更有用。
说我的数据是,
我想在 2014 年 3 月之前、2014 年 3 月之前、2014 年 3 月和 2016 年 4 月之间以及 2016 年 4 月之后创建一个类别。所以我得到了这样的东西,
最初的问题
假设我有一个这样的数据集,
现在,我可以用来对数值变量ifelse()
进行分类。a
像这样,
但是,如果我想创建一个表示某些时间段的变量怎么办。说在 2016 年 3 月之前, ,和2016-3
之间, 和 之后。我意识到我可以将数据转换为然后用于将其剪切然后将其重新组合在一起,但是没有更聪明的方法可以使用 if else on 来获得类似的东西吗?2016-3
2016-5
2016-5
ts
window()
yrQ
我想要达到的就是这样的事情,
r - R - 用分组数据中的因子水平重新编码 NA
我有一个纵向结构的数据框,如下所示:
我的标识符变量是oslaua
,我的时间变量是wave
。old.la
,la
和dclg.code
是具有 NA 的因子变量。我的目标包括使用与每个标识符 ( )NA
关联的每个变量的级别重新编码 my by 。oslaua
对于使用以下内容的情况,我尝试这样做old.la
:
我部分明白了我的目的,但您可以看到一些问题:
具体来说,因子的水平改变了它们的格式,并且在某些情况下,观察结果被错误地重新编码(例如oslaua = E06000001
- 第 3 行)
我不明白为什么关卡会改变它们的格式以及如何保持它们原来的(字母数字)格式。另外,为什么有些观察没有正确记录。
任何解决这些问题的建议都非常感谢。
谢谢!
r - 如何将以某个字母开头的值更改为 NA(在 R 中)
我有一个我正在使用的数据框,称为“鱼”。
数据框有 3 个不同的变量。其中一个变量称为“物种”。
有些物种以字母 M 开头。我想将所有以字母 M 开头的物种的值更改为缺失 (NA)。
我知道当你在做整个物种名称时如何将其更改为 NA,但是对于以字母 M 开头的物种,你如何做到这一点?
我试过这个:
但这不起作用。任何人都可以帮忙吗?
r - 不理解 ifelse 语句
我正在尝试根据其他两个变量重新编码一个变量,我认为我误解了该ifelse
语句的工作原理。
我有一列是字符串,另一列是整数。我希望新列与字符串相同,c1
除非整数列flag
等于 1,在这种情况下它将等于XX
.
我ifelse
这样使用:
我不确定这是否是重新编码的最佳方式。
当我要求查看新列时,我收到此错误:
macros - 重新编码并为 sas 变量添加前缀
假设我有一堆以相同方式命名的变量,我想重新编码它们并为每个变量添加一个前缀(变量都是数字)。
在Stata中,我会做类似的事情(假设变量以 开头eq
)
我怎样才能在 SAS 中做到这一点?我想使用 %DO 宏,但我不熟悉它们(我想避免使用 SQL)。如果您能包含解释每个步骤的评论,我将不胜感激!
r - 使用汽车重新编码变量 - 意外变量(.x 值)被视为 NA
我的目标是将我的变量重新编码为另一个具有反转值的变量:
这段代码已经为我服务了一年多,但突然间我收到了以下错误消息:
警告消息:视为 NA 的未替换值不兼容。请详细指定替换或提供 .default
我猜数据有问题,但我不知道是什么。变量的类是integer
,它没有缺失值。
有谁知道我能做什么?
提前致谢!