问题标签 [dummy-variable]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1368 浏览

r - lm() R 函数中的子集() 函数能否仅用于删除某些变量的观测值?

我不确定我的问题是否有意义。但是,我正在考虑使用时间序列数据修改计量经济学模型。这是一个多元回归。自变量之一是 5 年期国债利率。该变量分为两个时间段。一个变量是从 1950 年到 1986 年的 5 年期国债利率。1986 年之后,这个变量取值为 0。第二个变量是从 1986 年到现在的 5 年期国债利率。在 1986 年之前,第二个变量的值为 0。有人建议我将 0 值替换为空白(相当于缺失数据)。因为正如建议的那样,这些变量的含义应该会更好地指定。你能用子集()函数做到这一点。换句话说,您是否可以在不实际删除或忽略整行数据的情况下从这些变量中删除或忽略 0 值,并从其他自变量中删除所有值。我知道这个编码问题取决于这个过程是否有意义。我不确定它确实如此。我已经通过了交叉验证的理论问题。但是,我不确定我会得到任何答案。我想我会继续在这里问编码问题。

0 投票
1 回答
2208 浏览

r - 从多列制作虚拟变量并创建新的数据框

我需要从调查数据中制作一个假人数据框,其中受访者在数据框中的几列中陈述了单词。这是一个简化的示例来说明我需要做什么?一个单词在这里用一个字母表示。

这是我想要的输出?

有任何想法吗?

0 投票
1 回答
727 浏览

r - R中的因子和虚拟变量

我是数据分析和学习 R 的新手。我有几个非常基本的问题,我不太清楚。我希望能在这里找到一些帮助。请多多包涵..还在学习中-

我编写了一个小函数来对具有 9 个变量的数据集执行基本的探索性分析,其中 8 个是 Int/Numeric 类型,1 个是 Factor。功能是这样的:

我使用以下方法将其应用于数据集:

但是输出文件的所有变量类都是 Character,所有 Means 都是 NA。经过一番头疼之后,我认为问题出在 Factor 变量上。我使用以下方法将其转换为数字:

它工作得很好。但我很困惑,如果不查看数据集我使用上述函数 - 它不会工作。我该如何处理这种情况。

我什么时候应该考虑创建虚拟变量?

提前谢谢你,我希望问题不要太傻!

0 投票
3 回答
259 浏览

r - 将条件应用于 R 中的多个列

我有一个数据集,它以虚拟变量的形式代表每个客户的篮子。

例如:

其中 P1 代表产品 1,依此类推。

本质上,我想运行一个简单的查询,在其中我可以将所有大于 1 的值转换为 1。这样我的数据中只有 1 和 0。我能够使用以下方法完成几行:

是否有应用所有功能?

0 投票
1 回答
3106 浏览

python - 如何仅为列中的特定值生成虚拟变量?

我有一个 pandas 数据框列,其中填充了 100 个国家/地区的国家/地区代码。我想用这些来做回归,但我只想在我的数据集中为特定国家创建虚拟变量。

我认为这会起作用:

但这给了我错误:

KeyError: ('cc_US', 'cc_GB')

我的数据框目前看起来像:

没有假人

但我希望它看起来像这样:

带有虚拟变量

是否有一种简单的方法来指定您希望在get_dummies方法中包含哪些值,或者是否有另一种方法来识别特定的虚拟变量?

0 投票
2 回答
107 浏览

r - 将虚拟变量转换为实际值

我一直在研究以下列方式表示的数据集:

我正在尝试将其转换为 R 中虚拟变量不为 0 的行,例如:

我尝试了以下方法:将虚拟变量重新编码为有序因子,但是,我没有得到多个项目。我很高兴生成一个没有任何列名的新事务表。我希望对生成的数据集进行购物篮分析。

谢谢

0 投票
1 回答
1159 浏览

java - 将虚拟节点保存在链表中

我想在不删除/替换虚拟节点的情况下将新节点添加到列表中head,即head始终为null并且列表将从head.next (head -> node -> node -> node). 我在使用虚拟节点的语法时遇到问题,我不确定我是否做得对。smb可以看看吗?提前致谢!

nullPointer在构造函数的这一行中得到一个:

代码


班级Link


0 投票
1 回答
348 浏览

r - R - 转换为虚拟变量时内存不足

我有一个带有分类变量的数据集,级别数很丑(5000 左右)。当我运行我的代码以转换为虚拟变量时,它说它需要 22 gigs 的内存并崩溃

在这种情况下我该怎么办?寻求云解决方案?尝试优化功能?

0 投票
2 回答
3242 浏览

sql - 具有 NULL 值的虚拟 DATE 字段

我正在两个表之间执行联合。为了使 UNION 的两个表一致,我需要添加一个虚拟列。

一个表有 DATE 字段,而另一个表没有该字段。如何创建可以是“”(空白)或 NULL 的虚拟 DATE 字段?

我在 DB2 中尝试这样的事情

TO_DATE('','MM/DD/YYYY') AS DUMMY_DATE

0 投票
3 回答
765 浏览

r - 在 R 中创建虚拟变量的简单方法

我想知道如何简单地创建一个虚拟变量。我在假人上发现了许多类似的问题,但它们要么基于一些外部软件包,要么基于技术。

我有这样的数据:

Z 在 df 中创建一个新变量,即 X 变化和 Y 变化的乘积。现在我想在 df 中创建一个虚拟变量 D,如果:Z < 0 则 D==1,如果 Z >0 则 D== 0。

我尝试过这种方式:

这是行不通的。我想知道为什么上面的代码不起作用(通过简单的方法),以及如何在 R 中创建虚拟变量而不使用任何外部包,只需一点解释。