问题标签 [dummy-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
7738 浏览

python - 如何在 python scikit-learn 随机森林中使用虚拟变量来表示分类数据

我正在为 scikit-learn 的随机森林分类器生成特征向量。特征向量代表9个蛋白质氨基酸残基的名称。有 20 个可能的残基名称。因此,我使用 20 个虚拟变量来表示一个残基名称,对于 9 个残基,我有 180 个虚拟变量。

例如,如果滑动窗口中的 9 个残基是: ARNDCQEGH(每个字母代表一个蛋白质残基的名称),我的特征向量将是:

另外,我尝试使用 (1,0) 替换 (True,False)

在训练和测试 Scikit 的随机森林分类器模型后,我发现它完全不起作用。但是 Scikit 的随机森林可以与我的其他数值数据一起使用。

Scikit 的随机森林可以处理分类变量或虚拟变量吗?如果是这样,你能提供一个例子来说明它是如何工作的。

这是我设置随机森林的方法:

提前非常感谢!

0 投票
1 回答
17276 浏览

oracle11g - 什么是 oracle 虚拟表?

我现在正在学习 Oracle PL*SQL,并且对称为 DUAL Table 的虚拟表有一些理解困难。有人可以用简单的方式解释那是什么吗?请。

0 投票
2 回答
5124 浏览

r - R Query:从分类变量创建虚拟变量

你好 Stack Overflow 的人,我花了一段时间寻找解决我的问题的方法,但没有找到任何东西,所以我想我会发布。

基本上我有一个按字母顺序列出的 196 个国家的数据集。其中一个变量根据国家所在的地区分配一个 1-10 的数字。例如东欧 = 1、西欧 = 2、中东 = 3、南美 = 4 等等。

这是数据集的可视化表示:

国家名称-----国家地区------婴儿死亡率

阿富汗------------3------------180

阿根廷---------------4------------65

法国-------------------2------------------------12

德国---------------2-------------10

波兰-----------------1------------------------16

我需要做的是将这 10 个区域分成各自的虚拟变量,以便我通过多元回归对它们进行运行,以确定它们对婴儿死亡率的个体影响。

我想知道创建虚拟变量(1 = 东欧,0 = 其他等)的必要代码是什么,然后如何在单独和多元回归中测试它们的效果。

抱歉,如果这看起来很简单或愚蠢的问题,我对使用 R 相当陌生。

我在这里先向您的帮助表示感谢。

编辑:这是要求的 dput 输出:

0 投票
2 回答
6774 浏览

regression - Stata:超过 11,000 个虚拟变量的线性回归

我正在尝试使用超过 11,000 个虚拟交互项进行面板回归。我的回归看起来像这样:

其中i.county*i.year表示虚拟变量的交互作用。Stata、Matlab 和 R 都不会包含这么多变量。我不确定是否有一个命令可以增加我缺少的存储变量的数量(例如,stata 中的 -set matsize- 命令)。

我知道 Stata 矩阵的最大容量是 11,000 个变量。如何在 Stata 中运行此固定效应回归?马塔在这里是一个选择吗?

0 投票
1 回答
3020 浏览

sql - 如何在 CTE 内向 select 语句添加列以稍后添加值

我想在 CTE 中添加一个虚拟列。

稍后我想使用 update 语句更新虚拟列的值。

我正在更新或插入视图或函数失败,因为它包含派生或常量字段。

CTE 是

使用 update 语句更新 F 字段后出现异常。

0 投票
1 回答
2226 浏览

r - R-生成一个“缺失值变量”

我正在使用 R 为我正在教的统计课生成如何处理缺失数据的示例。一种方法需要生成“缺失值二进制变量”,包含缺失值的情况为 0,没有缺失值的情况为 1。例如

我想生成一个变量 M,这样

考虑到 R 处理缺失值的能力,这似乎应该很简单。我发现的最接近的是m <-ifelse(is.na(missguns),0,1),但这所做的只是生成一个新的完整数据矩阵,其中 0 或 1 表示缺失。但是,我只想要一个变量来指示一行是否包含缺失值。

0 投票
0 回答
193 浏览

python - 如何以编程方式创建虚拟电子邮件线程?

为了比较一些软件,我需要一个邮件线程,即一些带有回复的邮件和对回复的回复......内容无关紧要,但附件和richt-text会很好。

我想知道如何以编程方式创建这样一个虚拟邮件线程(最好使用 Linux 命令行工具或 Python)。

我将如何创建那些虚拟邮件?

0 投票
1 回答
179 浏览

android - 在外部存储android的文件中写入虚拟内容

在下面提到的代码中,我在一个名为“testfile.txt”的文件中编写了虚拟内容。但我想在外部存储的任何文件中写入虚拟内容。我不希望文件名被硬编码。我该怎么办?

0 投票
0 回答
609 浏览

android - 将虚拟数据写入外部存储android的选定文件

在下面提到的代码中,我将虚拟数据写入外部存储中存在的所有文件并重命名为“abc.txt”。但我想要的是仅将虚拟数据写入我选择并重命名该特定文件的那个文件。我该怎么办?

0 投票
3 回答
8777 浏览

r - 在 R 中创建二进制指标矩阵(布尔矩阵)

我有一个数据列表,表明参加这样的会议:

我想创建以下格式的二进制指标考勤矩阵:

有没有办法在 R 中做到这一点?