问题标签 [recode]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 R 中重新编码重复变量的最新发展?
所以我有一个很长的序列数据集。每列(从 t1 到 t...n)都具有相同的级别或类别。共有200多个类别或级别和144列(变量)。
变量 t1 具有相同的级别有 t2 等等。我需要的是对每一列进行循环式重新编码(但避免循环)。
我想避免通常的
最方便的重新编码风格是这样的
这将帮助我更好地将变量聚类到更大的类别中。
最近出现的 R 中有一些新的更简单的重新编码方法吗?你会建议我用什么?
这是我的真实数据集的样本,10 个受访者(行)的 5 次重复观察(列)。
r - r 根据条件重新编码字符串变量
我知道这可能很简单,但我找不到解决方法。我想根据另一个变量的条件重新编码一个字符串变量(到同一个变量中),但是我得到了一个错误。
一个工作示例:
然后我收到一个警告:
我知道这不是错误,但是当我查看结果时,VAR1 中 N 值低于或等于 30 的所有类别都设置为 NA
我究竟做错了什么?
另一个转折:如果我从聚合中获取数据,我会得到同样的错误,比如说:
和
重新编码似乎不起作用
有什么线索吗?
r - R data.table 多列重新编码/子分配
设 DT 为 data.table:
是否有更好/更简单的方法来进行多列重新编码/子分配,如下所示:
变量名是完全任意的,不一定有数字。许多列 (Vx:Vx) 和一个所有的重新编码模式 (NAME==1 | NAME==7, NAME:=something)。
此外,如何将多列子分配给其他东西。例如在 data.frame 样式中:
string - SPSS REPEAT:如何使用替代变量作为变量名的一部分?
我正在使用 SPSS 20。在我的数据集中是一个字符串变量列表,我想将其重新编码为数字。最初我希望它们被重新编码成它们自己。我意识到这是不可能的,因为 SPSS 逐个遍历数据集,并且一个变量一次只能有一种类型。所以我希望将它们重新编码为新变量,但后缀为_rec
.
但这只会创建一个新变量var_rec
而不是几个新变量。
我还尝试编写一个解决方法:
但这不起作用,因为DELETE VARIABLES
不能在DO REPEAT
循环中使用。
所以我回到我原来的问题。
r - 在 R 中运行迭代以创建具有特定条件的新变量
所以我有这些数据,我想做的是创建一个变量来反映每个给定年份中地位最高的群体。每个组可以具有以下状态:* 1 = 垄断,* 2 = 主导,* 3 = 高级,* 4 = 初级或 * 5 = 受歧视。1 或 2 组将自动获得最高状态,因为每个国家/地区在任何给定年份都只有一个组保持该状态。但是,有些国家/地区有多个属于 3 的组(有时 3 也是该国家当年可以达到的最高组状态),在这种情况下,我希望规模最大的组是编码为具有最高地位的人。我该怎么做呢?
数据
期望的输出
string - 如何在Stata中将字节变量重新编码为字符串变量
我正在尝试将我的 Stata 文件中的字节变量重新编码为字符串变量。但它向我显示了一个错误(说明它无法识别该元素)。串起来也不行。我可以在Stata中做到这一点吗?
我拥有的数据文件包括各大洲的人口统计信息。我根据预期寿命(lexp
)对其进行了重新编码。我正在使用的代码是:
现在我需要重新编码3
为字符串值A
。
使用recode lexp (3=A)
我明白了
规则中的未知 el A
r - 仅将某些因素转换为不同的因素
我正在尝试构建一个与其他两个具有完全不同因子水平的因子列相关的因子列。这是示例数据。
我要创建的规则创建一个新列 c,它基于列 a 的值来确定它的因子水平值。如果 a 列中的任何行 =“F”,则 c 列中的该行将等于 b 列中的条目。我正在尝试的代码:
仅吐出 b 列的因子级别的编号索引,而不是实际条目。我做错了什么?
r - 在 R 中重新编码值
如果 x >1 但 < 2,我想重新编码列中的值,它将被重新编码为 1
这是我的代码:
有什么不对吗?
我实际上需要重新编码所有值:
我想我知道问题出在哪里。当 R 运行第二行代码时,重新编码的值恢复到以前的值。
r - 通过转换表重新编码数据帧
我有一个包含 3 列的数据框。其中一列(项目)包括可能重复的长字符串(一些包括特殊字符,例如分号;为简单起见,这里写为 Tx)。我想找到特定列的所有唯一值。为每个唯一值创建以下格式的昵称:OV1、OV2、... OVn。我想保留这张表并称之为“转换表”。在下一步中,我想转到源表并使用转换表中的值重新编码每个值。
以下是源表的示例:
结果表将是:
转换表将是:
源数据在data6
(数据框)中。我使用了以下命令:
我现在将u1
用OV
值替换驻留在其中的所有唯一项列,并将其创建为转换表。之后替换data6$items
.
非常感谢你的帮助。
variables - 以相同的方式重新编码多个变量
我正在寻找以相同方式重新编码许多变量的最短方法。
例如,我有数据框,其中 a、b、c 列是调查项目的名称,行是观察结果。
我想更改选定列的所有观察值。例如,列“a”和“c”的值 1 应替换为字符串“low”,这些列的值 2,3 应替换为“high”。
我经常用很多列来做,所以我正在寻找可以用非常简单的方式来做的函数,比如:
几乎可以从包装汽车中重新编码功能,但如果我有 10 列要重新编码,我必须重写 10 次,它没有我想要的那么有效。