问题标签 [dummy-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 去除 R 中多重回归中的加性效应
我有这个数据集,我将用于我的模型
我被分配为他们创建一个乘法模型,其基础为 5,如下等式:
但我能做的最好的就是这个:
这个模型没问题,但我确实想消除加法效应,只得到乘法模型,我还将截距替换为 5,并为 b 和 c 的第一级创建差异系数。
R中有没有办法完成这项任务?
matlab - 为月末 MATLAB 创建虚拟变量
我有一个指数的每日收盘价,我想在每个月的最后一天之前和之后的特定天数创建虚拟变量。
说前4天和后4天。总共9天。我有 23 年的数据。
问题是月份的长度不相等(显然),并且数据不包括所有周末(使不相等的长度更加“不相等”)。
如何以有效的方式为数据创建虚拟变量,而无需手动查看每月最后一天前 4 天和后 4 天的 6000 多个观测值和精确日期?
%------------
我设法创建了一个包含 1991 年至 2014 年不包括周末的日期和回报的表格。第一列年份、第二个月、第三天和第四列返回:
现在我想为该月最后一个工作日之前的 X 天和该月最后一天之后的 X 天创建虚拟变量。说9天。所以假人 D-9、D-8...T、D+1、D+2...D+9。T=当月的最后一天。总共19个假人。剩下的日子将有一个单独的假人,ROM。然后我将这些用作回报的回归量。
我的预期结果将是所有虚拟变量的系数,这些变量描述了当月每个选定的日子(每月月初的 19 天)和当月剩余时间 (ROM) 的回报。它应该看起来像这样:
@丹尼尔
r - 使用 Quarter 虚拟变量进行线性回归
我正在尝试对以下数据进行线性回归
模型是
这工作正常。但是,它会自动为 3 个季度创建三个假人。有没有办法只包括一个假人,比如这个模型中的 Q2?
security - 从 mimetype 生成图像扩展
我一直在尝试在 Laravel 5 中上传图像(通过 laravelcollective/forms 生成的上传,并使用干预图像库进行处理)。我想做的是当用户上传任何照片时,我想根据它的 mimetype 设置扩展。应该有一些基本的检查来防止虚假数据注入。
为此,我应该像这样简单地映射吗?
r - 从列表创建虚拟变量
因此,我正在尝试根据框架的特定列中是否包含特定单词来创建虚拟变量以附加到数据框架。该列看起来像这样:
我将根据每行中包含的单词创建虚拟变量,例如,对于第一行,它包含"good", "night",
and "moon"
,但不包含"room", "morning"
or "hello"
。
到目前为止,我一直在以一种非常原始的方式进行操作,即创建一个适当大小的 0 值矩阵,然后使用这样的 for 循环:
或类似的东西。我猜有一种更快/更高效的方法来做到这一点。有什么建议吗?
rest - MailChimp 是否有一个沙盒 API,其中包含用于测试的虚拟数据?
我想开始使用 MailChimp API 创建一个实用程序,该实用程序只需从用户帐户中提取一些指标,例如订阅者、上次活动日期(不确定该日期是否可用)、打开率等。
我面临的一个关键问题是,虽然我有一个免费的 MailChimp 帐户,但其中没有任何数据(没有列表、订阅者、活动等),这使得它不太适合测试。
所以我想知道我最好的选择是什么,即:
- 我是否应该手动创建一些虚拟数据(例如将自己添加为列表的订阅者,然后给自己发送一些电子邮件?),
- 还是他们(MailChimp)提供了一个“沙盒”帐户,其中已经有一些更丰富的测试/虚拟数据?或者,
- 一些其他的选择...
PS - 我正在使用 MuleSoft 来完成这个集成任务(我提到它是因为这个信息可能有助于回答)。
r - 用虚拟变量预测 linearRidge
我正在尝试使用下面的代码和库中的 GenCont 数据进行岭回归ridge
但是如果我在模型中使用虚拟变量,我会得到这个错误
有没有办法在 R 中预测 Ridge 回归中的虚拟变量?
r - ggplot 制作没有明确 y 变量的描述性条形图
我一直在尝试使用 ggplot 和一个巨大的数据集创建一个比例堆积条形图,该数据集是一列虚拟变量和一列具有 14 个不同级别的因子变量。我在这里发布了一小部分数据样本。
尽管我的数据中没有明确的 y 变量,但我可以生成一个图,该图仅在查看具有大量观察值的因素时才真正有用,但是当只有一两个时,您根本看不到比例. 我使用的代码在这里。
ggplot 说您需要将 ddply 函数应用于数据框。
他们的例子并不真正适用于这个数据的情况,因为在图中没有明确的 y 变量可以调用;只计算 1 或 0 的每个因子。
我对 ddply 函数的最佳猜测会吐出一个关于不同行数的错误。
php - Web 应用程序的实时虚拟数据
我正在设计我编写的软件的现场演示版本。该数据库使用 MySQL 建模,并带有可供使用的虚拟数据。我想做的是让它在用户登录以尝试演示时生成,并在他/她注销或关闭系统后将其删除。解决此类问题的最佳方法是什么?
numpy - Pandastic 增长数据框的方式
所以,我有一个年份索引的数据框,我想在年底(2013 年)之后增加一些逻辑,比如说,在 10 年内将最后一个值增加 n%,但逻辑也可能只是添加一个常量,或略有增长的数字。我将把它留给一个函数,并在那里填充逻辑。
我想不出一种简洁的矢量化方式来使用任意长度的时间和逻辑来做到这一点,留下更长的数据帧并添加额外的增量,并且不希望循环它。