问题标签 [recode]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
80 浏览

r - 重新编码列数值变量

我有一个更大的数据集,我需要将一列更改numercal variablecategorical variable. 数据示例如下:

列中的变量Pa需要替换为以下内容:

对于较小的数据集,我可以通过包中的recode函数手动完成car

我需要一个适当的函数或代码来代替重新编码中的手动输入。

0 投票
1 回答
489 浏览

r - 使用许多和/或语句将多个变量重新编码为一个变量

我正在尝试从 SPSS 转换为 R;我想将我的清理语法翻译为学习 R 的好方法,但我在 SPSS 中的简单命令方面遇到了很多麻烦。

以下代码在 SPSS 中有效:

我认为这段代码在 R 中会做同样的事情,但是单元频率不一样(注意我在 R 中将 n_ethnicity 重命名为 n_eth)。我将不胜感激任何帮助!谢谢!

0 投票
3 回答
551 浏览

loops - SPSS将变量数据从多个变量重新编码为布尔变量

我有 26 个变量,每个变量都包含从 1 到 61 的数字。我希望每种情况下为 1,每种情况下为 2,等等。新变量中的数字 1。如果没有 1,则变量应包含 2。因此 26 个变量的数据如下:1 15 28 39 46 1 12 等。

我想要 61 个变量:1 2 1 2 2 1 等。

我一直在阅读有关创建向量、循环、执行 if 等的信息,但我找不到正确的编码方式。我所做的只是创建 61 个变量并编写

如果 V1=1 或 V2=1 或(等到 V26),请执行此操作。

重新编码 newV1=1。

万一。

可执行程序。

**对所有 61 个变量重复此操作。

将 newV1 重新编码为 newV61(缺失=2)。

所以这是很多代码,与我想象的相差很大。

谁能帮我解决这个问题?非常感谢您的帮助!

0 投票
1 回答
6466 浏览

r - If else 有条件的重新编码

我在data2中有一个变量“dif2”,我将向名为“L”的数据集添加一个新变量,条件是(如果-0.1 <= dif2 <= 0.1,L ==“B”,而如果 dif2 > 0.1,则 L == "S",如果 dif2 <-0.1 则 L == "E")

我尝试了不同的方法。首先我使用 for 循环:

这效果不好。

然后我像这样直接使用重新编码:

这也不好用(-0.1 和 0 之间的一些数字没有正确编码)

0 投票
2 回答
82 浏览

r - 从同一变量中的多个值计算 R 中的变量

假设我们有一个名为 df 的数据集,该数据集由名为 year 和 x1 的两个变量组成:

我的任务是从 x1 中计算出两个新变量。第一个变量是 cSum,它必须反映过去两年 x1 值的总和。第二个变量是 cMax,它必须反映过去三年中 x1 的最高值。

结果应如下所示:

如何计算上面的 cSum 和 cMax 变量?

谢谢!

0 投票
1 回答
1096 浏览

r - 重新编码后将标记的变量强制为数字

在 Haven 或标签包中是否有更简单的方法将标签变量转换为数值变量?

以下代码说明了我的问题。在重要的 sav 文件之后,每个变量都是一个标记变量。有些最初是数字变量,其中 98 和 99 作为缺失值。所以我必须重新编码那些设置为 NA,但是我必须用 as.numeric() 将重新编码的变量强制为数字

有没有更简单的方法来做到这一点?

0 投票
1 回答
50 浏览

r - 将一个数据集重新编码为另一个

请参阅下面的简化数据集,该数据集以国家/地区为基础:

我的问题是:

如何编写代码来创建上述数据集的基于事件的子集,如下所示:

换句话说,我需要将每个事件分别编码到一个新的数据帧中。(例如,上面 df2 中的第一行是CountryA 从 2001 到 2003 的事件。)在执行此操作时,我还需要重新编码相应时间范围内的值。(例如,df2 中的 v1Max 是事件持续时间内 v1 在 df1 中的最大值。同样,df2 中的 v1Ave 是平均值。)

如果您可以提供执行上述从 df1 到 df2 的转换的代码,我可以对其进行增强以解决我的问题。

谢谢!

0 投票
3 回答
158 浏览

r - R中的条件重新编码和求和

我的(样本)数据如下所示:

我想创建 1 个新变量newvar1

  • 如果 x1 = 0 => 我想计算整个数据集中 x1 等于 1 的次数(仅其他行,不包括自己的观察结果),但只计算具有相同 x2 和 x3 组合的行以及其中周数大于 24。

  • 如果 x1 = 1 => 我想计算整个数据集中 x1 等于 1 的次数,但只计算 x2 和 x3 组合相同的行以及周数减去 25 大于零的行((第 25 周)> 0))。

“总和”是指如果条件成立,x1 等于 1 的次数。

“如果”我的意思是我只想在 if 之后的条件成立时对 x1 求和。基本上我的问题是:我怎样才能只根据条件对某些值求和?

我的数据应如下所示:

目前我有以下代码,但这没有考虑到x2=x3一周的限制。任何建议如何做到这一点?

0 投票
2 回答
117 浏览

r - R用分组数据的水平创建一个变量

我有一个数据框,例如data

我想知道是否可以在ID(例如A,,B)中获取每个组的级别C并创建一个粘贴它们的变量。我试图通过运行以下命令来做到这一点:

这会产生:

但是,我想要的data.frame应该是:

0 投票
1 回答
1499 浏览

r - read_excel 将数字重新编码为 na 值

read_excel在使用包中的函数从 excel 文件中导入数据时readxl,我尝试为na参数指定一个数字,但它不会重新编码缺失的值。数据以数值作为缺失响应输入。

示例数据(虽然在 r 而不是 excel 文件中):

如果上述数据是一个单独的 excel 文件,我尝试像这样读取它:

与其将 99 重新编码为 NA,不如将它们作为数字读入。我希望看到这样的数据框,而不必使用单独的步骤来重新编码数据: