问题标签 [data-management]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
4570 浏览

r - 如何在 R 中创建、构造、维护和更新数据码本?

为了复制,我喜欢为每个数据帧保留一个包含元数据的码本。数据码本是:

一个书面或计算机化的列表,对将包含在数据库中的变量提供清晰和全面的描述。 Marczyk 等人2010 年

我喜欢记录变量的以下属性:

  • 姓名
  • 描述(标签、格式、比例等)
  • 来源(例如世界银行)
  • 源媒体(网址和访问日期、CD 和 ISBN,或其他)
  • 磁盘上源数据的文件名(有助于合并码本)
  • 笔记

例如,这是我正在实施的记录数据框mydata1中的变量的方法,其中包含 8 个变量:

我为我阅读的每个数据集编写了不同的密码本。当我合并数据帧时,我还将合并其相关代码本的相关方面,以记录最终数据库。我通过基本上复制粘贴上面的代码并更改参数来做到这一点。

0 投票
1 回答
1876 浏览

r - R:从滚动窗口中创建数据框

假设我有一个具有以下结构的数据框:

将“DF”转换为具有以下结构的数据框的最有效方法是什么:

其中 w 是通过数据框“DF”滚动的长度为 2 的窗口。窗口的长度应该是任意的,即长度为 3 产量

我有点被这个问题难住了,因为数据框还可以包含任意数量的列,即 w、x、y、z 等。

/edit 2:我意识到编辑 1 有点不合理,因为 xts 似乎无法处理每个数据点的多个观察结果

0 投票
3 回答
1867 浏览

r - 如何使 doSMP 与 plyr 很好地配合?

此代码有效:

虽然此代码失败:

我正在使用 R 2.1.12、plyr 1.4 和 doSMP 1.0-1。有没有人想出办法解决这个问题?

编辑:作为对安德烈的回应,这里有一个进一步的说明:

前三个功能有效,但它们都需要大约 3 秒。函数 #2 发出警告,表示没有注册并行后端,因此按顺序执行。函数 #4 给出了我在原始帖子中引用的相同错误。

/ 编辑:curioser 和好奇者:在我的 mac 上,以下工作:

但这失败了:

这也失败了:

所以我认为 foreach 的各种并行后端是不可互换的。

0 投票
3 回答
1880 浏览

r - 将数据帧拆分为重叠的数据帧

我正在尝试编写一个行为如下的函数,但事实证明它非常困难:

我没有想过如果你尝试类似的事情会发生什么OverLapSplit(DF,nsplits=2,overlap=1)

也许如下:

谢谢!

0 投票
1 回答
112 浏览

php - 处理 Singleton 类实例

我在 PHP 中创建了一个单例类:

现在当我尝试在我的 index.php 中使用这个类时:

我得到的唯一回声是“test”,单例类中的函数 test() 似乎从未被调用过。index.php 末尾的“testend”也从未被调用过。

我的单身课程有错误吗?

0 投票
2 回答
1712 浏览

r - 使用列表中的数据框:删除变量,添加新变量

使用两个数据框 df1df2定义一个列表dat

我想在每个数据框中删除变量a。接下来,我想添加一个变量,其中包含来自外部数据帧的每个数据帧的 id,例如:

为了删除不必要的变量,我尝试了这个没有运气:

也不知道如何添加id。

我也尝试过,也许更合适:

我发现令人困惑的是str(out[1])返回一个列表,str(out[[1]])返回一个数据框。我认为这可能与它有关。

0 投票
3 回答
433 浏览

list - 在数据框列表内的数据框中编辑变量中的单元格条目

定义:

我想从每个数据框中的 b 列中删除 M 字符。

在一个简单的框架中:

但是在嵌套中,如何进行?这是一个抱歉的尝试:

0 投票
2 回答
2504 浏览

r - 在每个变量上使用不同的函数逐组折叠数据

定义

英石

我的数据没有因子,所以我将因子转换为字符:

我想通过 V1 保持“折叠”数据框:

  • V2的最大值
  • V3 的平均值
  • V4 的模式(这个值在 V1 组中实际上并没有改变,所以 first、last 等也可能会改变。)

请注意,这是一个普遍的问题,例如我的数据集要大得多,并且在折叠时我可能想要使用不同的函数(例如,last、first、min、max、variance、st.dev. 等用于不同的变量)。因此,函数参数可能会很长。

在这种情况下,我想要以下形式的输出:

0 投票
3 回答
3024 浏览

r - 创建一个按组捕获最频繁出现的变量

定义:

英石

我想创建第三个变量,其中包含stfreq中最常见的观察v1结果id

0 投票
1 回答
2455 浏览

list - 使用列表中的数据框:重命名变量

定义:

英石

我想将所有变量名从全部大写更改为小写。我可以用一个循环来做到这一点,但不知何故无法让这个lapply调用工作:

这导致:

而期望的结果是: