问题标签 [dummy-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
180 浏览

r - R:将几个字符重新编码为一个新的因素

我是 R 新手,在这个网站上找不到我的问题的具体帮助。

我的数据框 $grant_database、country_1 到 country_10 中有(除其他外)十个字符变量。每个都包含一个国家代码,例如 E20、F27 或 G10,或者一个 NA。每个案例都是对项目的资助。十个国家变量指定赠款受益的国家/地区。在我的数据框中,大多数(但并非所有)案例都会有至少一个国家代码,首先在 country_1 中进行标记,许多情况下也会有一个用于 country_2,有些甚至是用于 country_3 到 _10。所有空字段都标有 NA。

我希望创建一个新的因素来标记有利于特定国家子集的赠款。对于在十个国家变量中至少有一个与国家代码列表相对应的每种情况,这个二进制“虚拟”变量应该给出值“1”。对于在其十个国家变量中的任何一个中没有相应国家代码的每个案例/授权,它应该给出“0”。让这个要标记的国家代码子集为:E20、F27 和 G10(实际上,大约有 40 个要标记,从 150+ 开始)。

你会通过建议一种编程方法来帮助我吗?非常感谢您的帮助!

0 投票
2 回答
1466 浏览

r - 创建虚拟变量以进行双向方差分析

我为双向方差分析自行创建了一个小数据框。我想通过以下方式执行双向 ANOVA 模型

时间是因变量,而 Bact 和温度是两个分类自变量。

我不想以方差分析的方式进行,而是想学习并证明方差分析也可以使用线性回归模型来完成。我想将我的数据转换为虚拟变量并对其执行线性回归。我希望我会恢复相同的结果。虚拟变量还将包括 Bact 和 Temperature 之间的交互作用。

问题是,我不知道如何将我的数据框转换为虚拟变量,以便可以在 lm() 函数中使用。

0 投票
1 回答
993 浏览

r - 具有滞后因变量的 R 预测

使用 lm 函数 in 拟合(Pt=a Pt-1 + b Xt + 每个季度的虚拟变量)来拟合样本数据。如何创建 n.ahead=12 预测?无法弄清楚如何设置虚拟和 Pt-1 前迭代。感谢任何帮助!

0 投票
3 回答
11778 浏览

c# - 如何将巨大的虚拟数据插入 Sql 服务器

目前开发团队已经完成了他们的应用,作为测试人员需要在20张表中插入1000000条记录,进行性能测试。

我浏览了表格,实际上所有表格之间都有关系。

要将这么多虚拟数据插入表中,我需要在很短的时间内完全理解应用程序,以便此时我也没有虚拟数据。

SQL server没有办法插入这么多数据插入的可能性。

请分享方法。

  1. 目前我正在计划在excel中创建虚拟数据的可能性,但在这里我不确定表之间的关系。
  2. 在 Google 中发现SQL Profiler会提供执行顺序,但等待访问来分析这个。
  3. 我在 Google 中发现的另一件事是red-gate可以使用

是否有任何脚本或任何其他解决方案可以以简单的方式执行此任务。

如果这是一个常见问题,我很抱歉,我是第一次在 SQL 实时场景中工作。但我有关于 SQL 的知识。

0 投票
2 回答
88 浏览

r - 对多个虚拟变量执行操作

给定一个数据框,

我想计算一组多个虚拟变量中每个变量的平均值。

就像在多行上使用tapply,aggregateave(x,y,mean)函数一样,同时创建一个新的变量/列。不幸的是,我事先不知道虚拟变量的数量。我唯一知道的是虚拟变量从第 2 列开始。我的结果如下所示:

或像这样:

在我的场景中,我有从 1 到 x 的未知数量的假人,所以我可能只有 dummy2,但也许我有“dummy1”和虚构的假人“dummy5”和“dummy6”。完美的解决方案将允许我为第 2 列之后的所有列创建“m_dummy”列。因此,如果 dummy3 丢失或有额外的 dummy4,它也可以工作dummy4 <- c(1,0,0,0,0,0,0,1,0)

0 投票
1 回答
2191 浏览

rstudio - 如何在 RStudio 中创建虚拟变量?有数字数据?

工作 0:失业者/非技术人员 - 非居民 1:非技术人员 - 居民 2:技术人员/官员 3:管理人员/个体经营者/高素质员工/官员 历史 0:没有学分
1:该银行的所有学分都已按时偿还2: 现有的信用到现在还清 3: 过去延迟还清
4: 关键账户

0 投票
1 回答
4295 浏览

sql-server - 在查询中创建其值来自条件的虚拟列

正在准备一个查询,我将在 Crystal Report 中使用它,到目前为止查询工作正常,但我想再添加一个列(虚拟列),它将根据条件填充,这是查询:


如果 Segment_0 以“01”开头,则虚拟列中的值将显示“A” 如果 Segment_0 以“02”开头,则虚拟列中的值将显示“L” 如果 Segment_0 以“03”开头,则虚拟列中的值将显示“E”,我尝试使用 if 语句和大小写,但运气不在我身边:(

0 投票
1 回答
394 浏览

html - 用虚假但美观的数据填充 HTML/CSS 设计的 JavaScript 库?

假设我有一个 CSS/HTML 设计,我想向客户展示它。我不想用 lorem ipsum 和placehold.it填充它,而是想用更真实(或更好)的数据填充它。

另外我想避免重复内容块。例如,而不是编写下面的代码:

我想这样写:

我确信我已经看到一个 JavaScript 库可以做到这一点,但我找不到它。

0 投票
1 回答
11241 浏览

python - 熊猫:get_dummies vs categorical

我有一个数据集,其中有几列包含分类数据。

我一直在使用 Categorical 函数将分类值替换为数值。

我最近遇到了 pandas.get_dummies 函数。这些可以互换吗?使用一个比另一个有优势吗?

0 投票
2 回答
6125 浏览

r - 将多个二进制列转换为单个分类列

我有一个充满二进制变量的表,我想将其浓缩为分类变量。

非常简单地说,我有一个这样的数据框:

我想回来的是:

我希望有一个非常简单的答案。