问题标签 [data-manipulation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
293 浏览

r - 为时间序列创建未来值矩阵

我在 R 中有一个时间序列。我想构建一个矩阵,其中每一行是当前观察值,每一列代表该序列的未来值,从该点开始。例如:

在这种情况下,我们有一个包含 25 个观测值的时间序列,因此我们的最终矩阵有 24 行。从第 1 行开始,接下来的 12 次观察是 2-13。第 2 行是 3-13 等。在矩阵的末尾,我们用 NA 值填充它。

for如果不使用丑陋的循环,我怎么能做到这一点?

编辑:如果数据以另一种格式返回,例如 data.frame 甚至是行列表,那就没问题了。

编辑:这里有一些代码来比较我们目前拥有的 3 个函数:

0 投票
1 回答
250 浏览

r - 重新编码变量

我想重新编码一个变量,例如,我们可以通过以下方式转换这个向量:

这些变量遵循一个顺序,恰好是一个时间顺序。在原始数据集中,我有一个编码为“0”或“1”的变量,例如此处示例中的“a”。它是每年的分类指标。在某些时候,会出现从“0”到“1”的转变,就像这些示例中的第 6 行一样。然后我想重新编码原始变量,创建一个新变量,它实际上告诉我从“0”变为“1”之前和之后多少年。因此,“-5”表示转换前五年,“0”表示转换年份,例如,“4”表示转换后四年。有什么建议最好的方法吗?谢谢!安东尼奥。

0 投票
3 回答
90 浏览

matlab - Matlab 边界修整

我有一个矩阵A:

南 南 南 南 南 南 南 南 10 1 8 7 2 5 6 2 3 49 南 南 南 南 南 南 南 南

我想知道是否有一种方法可以检测 NaN 何时首次变为数字并将第一个 2 点变为 NaN,例如将 10 和 1 都变为 NaN。

然后找到数字何时变为 NaN,并将最后两个数字点 3 和 49 变为 NaN。

最初我正在考虑使用以下方法,但我想知道这是否是最好的方法:

但想知道是否还有其他方法可以优化它?

0 投票
2 回答
1054 浏览

r - 将方阵分成对

我有一个大方阵12128 x 12128。例子

我有一个配对列表(# 18000),它们存在于矩阵中所有可能的配对中

我只需要矩阵中列表中对的值。有没有比分解整个矩阵 ( melt(matrix)) 更简单的方法?谢谢

0 投票
3 回答
2078 浏览

sql - 将不同行的布尔结果合并为单行

我有一个返回多行的连接查询

第一列 ID 可以省略,这给我们留下了

由于返回的所有数据都适用于 SearchID 1,因此我希望得到一个将合并所有布尔字段的结果的行,即

IsButton 应为 1,因为有一行或多行为 1 AutoRun 应为 1,因为有一行或多行为 1 IsOnMain 应为 0,因为没有行为 1

但我想为可能已返回的多行处理此问题,并且我想为每个 searchid 最终得到一个唯一的行

我说得有道理吗?

0 投票
1 回答
3536 浏览

r - 根据 R 中的 grep 返回编码新变量

我有一个变量actor,它是一个字符串,包含类似的值"military forces of guinea-bissau (1989-1992)"和大量其他相当复杂的不同值。我一直在使用grep()来寻找匹配不同类型演员的角色模式。例如,我想将一个新变量编码为何actor_type时包含,不包含,并且字符串变量也包含在变量中。1actor"military forces of""mutiny of"countryactor

我不知道如何有条件地创建这个新变量而不诉诸某种可怕的 for 循环。帮我!

数据大致如下:

0 投票
1 回答
7657 浏览

r - R - 从 csv 到 xts 的股票市场数据

我在 CSV 中有这些数据:

这些是秘鲁股市的股票收盘价,我想将它们转换为 xts,以便找到最佳投资组合和其他东西,但我找不到将此 CSV 转换为 xts 的方法。我已经在这里查看了许多问题的答案,但没有一个有效。

我遇到的一些错误是:

  • 索引在数据行中有 XXXX 错误条目
  • 模棱两可的数据。

有谁能够帮助我?

0 投票
2 回答
2433 浏览

r - R中的自动虚拟变量

我有以下创建的数据框:

我正在寻找创建 11 个虚拟变量。前 10 名各一个,“其他”各一个。可以通过以下方式轻松找到前 10 名:

我知道 R 很棒,所以我假设有一个易于自动创建(和命名)前 10 名的虚拟变量并将其余部分折叠成一个名为“其他”的最终虚拟变量。

提前感谢您的任何帮助或见解。

0 投票
1 回答
29783 浏览

gnuplot - 需要在 gnuplot 中绘制每一行

我正在使用 gnuplot 并且有一些具有超过 2 个参数的数据。我不想使用 3D 图表。所以我将在同一个图中将数据分成几行。

在一种情况下,我的数据如下所示:

首先是我使用的流数,其次是缓冲区大小,最后是此操作的时间使用。

我想要一个图表,其中缓冲区大小为 X,时间为 Y,并且每个“使用的流数量”都有一条线。到目前为止我的代码:

我现在的主要问题是它绘制的所有内容都是正确的,但它不会在图之间划线。我在“使用”命令下的手册中读到:

应该注意的是,使用 1:2 绘制 'le'、绘制 'le' 和使用 ($1):($2) 绘制'le' 可能略有不同:1) 如果 le 有一些行只有一列,一些行有第二,第一个将在缺少 x 值时发明它们,第二个将悄悄地忽略具有一列的线,第三个将为具有一个点的线存储一个未定义的值(因此在具有线的图中,没有线连接点穿过坏点);2)如果一行在第一列包含文本,则第一列将在出错时中止绘图,但第二和第三列应该悄悄地跳过垃圾。

我想我在第三类并且没有线条,因为每个情节之间都有 4 个无效情节,但我找不到任何方法来解决它。

我找不到让它忽略无效图的方法。而且似乎没有任何我能找到的预处理方法可以删除未使用的图。但我可能错过了一些东西。

0 投票
1 回答
6493 浏览

sas - SAS为组的其余部分返回组中的第一个值

假设我有以下数据,但我基本上想为组中的其余值(底部的表)复制 a 和 b 的第一个值。

例如,在第 1 组中,a = 3 中的第一个值。我想将组中的 2、4、1 替换为 3——变量 b 相同。

原始数据:

更新数据:

提前致谢。