问题标签 [data-management]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何在 R 中创建、构造、维护和更新数据码本?
为了复制,我喜欢为每个数据帧保留一个包含元数据的码本。数据码本是:
一个书面或计算机化的列表,对将包含在数据库中的变量提供清晰和全面的描述。 Marczyk 等人(2010 年)
我喜欢记录变量的以下属性:
- 姓名
- 描述(标签、格式、比例等)
- 来源(例如世界银行)
- 源媒体(网址和访问日期、CD 和 ISBN,或其他)
- 磁盘上源数据的文件名(有助于合并码本)
- 笔记
例如,这是我正在实施的记录数据框mydata1中的变量的方法,其中包含 8 个变量:
我为我阅读的每个数据集编写了不同的密码本。当我合并数据帧时,我还将合并其相关代码本的相关方面,以记录最终数据库。我通过基本上复制粘贴上面的代码并更改参数来做到这一点。
r - R:从滚动窗口中创建数据框
假设我有一个具有以下结构的数据框:
将“DF”转换为具有以下结构的数据框的最有效方法是什么:
其中 w 是通过数据框“DF”滚动的长度为 2 的窗口。窗口的长度应该是任意的,即长度为 3 产量
我有点被这个问题难住了,因为数据框还可以包含任意数量的列,即 w、x、y、z 等。
/edit 2:我意识到编辑 1 有点不合理,因为 xts 似乎无法处理每个数据点的多个观察结果
r - 如何使 doSMP 与 plyr 很好地配合?
此代码有效:
虽然此代码失败:
我正在使用 R 2.1.12、plyr 1.4 和 doSMP 1.0-1。有没有人想出办法解决这个问题?
编辑:作为对安德烈的回应,这里有一个进一步的说明:
前三个功能有效,但它们都需要大约 3 秒。函数 #2 发出警告,表示没有注册并行后端,因此按顺序执行。函数 #4 给出了我在原始帖子中引用的相同错误。
/ 编辑:curioser 和好奇者:在我的 mac 上,以下工作:
但这失败了:
这也失败了:
所以我认为 foreach 的各种并行后端是不可互换的。
r - 将数据帧拆分为重叠的数据帧
我正在尝试编写一个行为如下的函数,但事实证明它非常困难:
我没有想过如果你尝试类似的事情会发生什么OverLapSplit(DF,nsplits=2,overlap=1)
也许如下:
谢谢!
php - 处理 Singleton 类实例
我在 PHP 中创建了一个单例类:
现在当我尝试在我的 index.php 中使用这个类时:
我得到的唯一回声是“test”,单例类中的函数 test() 似乎从未被调用过。index.php 末尾的“testend”也从未被调用过。
我的单身课程有错误吗?
r - 使用列表中的数据框:删除变量,添加新变量
使用两个数据框 df1和df2定义一个列表dat
我想在每个数据框中删除变量a。接下来,我想添加一个变量,其中包含来自外部数据帧的每个数据帧的 id,例如:
为了删除不必要的变量,我尝试了这个没有运气:
也不知道如何添加id。
我也尝试过,也许更合适:
我发现令人困惑的是str(out[1])
返回一个列表,str(out[[1]])
返回一个数据框。我认为这可能与它有关。
list - 在数据框列表内的数据框中编辑变量中的单元格条目
定义:
我想从每个数据框中的 b 列中删除 M 字符。
在一个简单的框架中:
但是在嵌套中,如何进行?这是一个抱歉的尝试:
r - 在每个变量上使用不同的函数逐组折叠数据
定义
英石
我的数据没有因子,所以我将因子转换为字符:
我想通过 V1 保持“折叠”数据框:
- V2的最大值
- V3 的平均值
- V4 的模式(这个值在 V1 组中实际上并没有改变,所以 first、last 等也可能会改变。)
请注意,这是一个普遍的问题,例如我的数据集要大得多,并且在折叠时我可能想要使用不同的函数(例如,last、first、min、max、variance、st.dev. 等用于不同的变量)。因此,函数参数可能会很长。
在这种情况下,我想要以下形式的输出:
r - 创建一个按组捕获最频繁出现的变量
定义:
英石
我想创建第三个变量,其中包含stfreq
中最常见的观察v1
结果id
list - 使用列表中的数据框:重命名变量
定义:
英石
我想将所有变量名从全部大写更改为小写。我可以用一个循环来做到这一点,但不知何故无法让这个lapply
调用工作:
这导致:
而期望的结果是: