问题标签 [reshape]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
666 浏览

r - 如何根据R中识别向量的元素为数据框分配重复次数?

我有一个数据框,其中的个人分配了一个文本 id,该文本 id 将地名与个人 id 连接起来(参见下面的数据)。最终,我需要将数据集从“长”转换为“宽”(例如,使用“重塑”),以便每个人只包含一行。为了做到这一点,我需要分配一个“时间”变量,reshape 可以使用它来识别随时间变化的协变量等。我有(可能是坏的)代码来为重复最多两次的个人执行此操作,但需要能够识别多达 18 次重复出现。如果我删除哈希前面的行,下面的代码可以正常工作,但最多只能识别两次重复。如果我把那条线留在里面(这对于重复两次以上的人来说似乎是必要的),R 会窒息,

有人能帮忙吗?提前致谢!

0 投票
3 回答
2419 浏览

r - 使用 plyr 改善基于重塑的习惯:melt/cast 与 ddply

我有点习惯了,melt而且cast这一次我正在寻找整洁的单线。

这是可能的ddply吗?我很渴望单线。我试过:

当然,这是可行的,但不是通过hpcyl总结am。我已经有一段时间没有使用了plyrreshape所以我有点失去了肌肉......所以......借口-moi pour une question triviale... =/

0 投票
2 回答
323 浏览

performance - 在 R 中加速将人重塑为周期格式的数据帧

我有一个数据集,其中包含面向人的格式的纵向数据,例如:

这会产生一个大型数据框,其中至少有 50k 个观测值和 90 个变量,最多可测量 29 个周期。

我想获得一个更面向周期的格式,例如:

我尝试了不同的方法来重塑数据框(*apply, plyr, reshape2, 循环,追加与预填充所有数字矩阵等),但似乎没有得到合适的处理时间(子集 +40 分钟)。在此过程中,我已经收集了各种关于要避免什么的提示,但我仍然不确定我是否错过了一些瓶颈或可能的加速。

是否有处理这种数据处理的最佳方法,以便我可以评估在纯 R 代码中可以实现的最佳处理时间?Stackoverflow 上也有类似的问题,但都没有给出令人信服的答案……

0 投票
2 回答
552 浏览

r - 如何将数据重塑为宽格式?

我有一个这样的数据集:

如何将这些数据重塑为宽格式?我试过这个

但这并没有给我正确的结果。正确的结果是:

0 投票
4 回答
56968 浏览

r - 将数据框重新排列到表格中,与“融化”相反

我有这样的巨大数据框:

我想“解开”到一个表,每个级别作为单列并填充 myvar:

我怎样才能做到这一点,我知道这是一个简单的问题,但我想不通。

0 投票
2 回答
4098 浏览

reshape - 在Stata中生成具有行中变量和列中给定变量的分位数的均值表

...并为差异和 t 统计量添加列。

我学会了如何通过分位数表制作分位数以及如何在此处添加一列/行差异(感谢@lejohn)。

现在,而不是将每一行作为一个变量的一个分位数,我希望每一行都是一个不同的变量,并且每个单元格将是每个变量的平均值,对于每个列中的个体来说,对于给定变量的分位数。

我可以使用 轻松计算单元格条目tabstat,但我想要行中的变量和列中的分位数(tabstat产生转置)。我还希望能够区分列(如我的第一个问题)并计算单元格差异的 t 统计量。

我觉得中间步骤是reshape用三列长数据:id(这里是 acc_d)、变量名和变量值。但我无法弄清楚如何做到这一点,我可能会陷入 R 范式。

这是我想做的类型表的一个例子

在此处输入图像描述

这是我一直(不成功)修改的一些代码

谢谢!

0 投票
3 回答
39298 浏览

r - 如何旋转/取消旋转(投射/融化)数据框?

如何“取消透视”表?什么是正确的技术术语?

更新:这个词叫做融化

我有一个国家数据框和每年的数据

我想要类似的东西

0 投票
4 回答
1340 浏览

r - R重塑,按块重组数据帧

我正在尝试重塑数据框:

目前它看起来像这样:

我想要类似的东西:

(A1 和 B1 / A2 和 B2 是相同的变量(就内容而言),因此例如:A1 和 B1 都是测试 1 的结果的变量,而 A2 和 B2 都包含测试 2 的结果。所以为了评估它,我需要将Test1的所有结果放在一列中,将Test 2的所有结果放在另一列中。我试图用“melt”来解决这个问题,但它只是一个接一个地熔化数据帧,而不是块。(因为我需要保持前 2 列的原样,并且只重新排列最后 4 列,但作为三个块)还有其他想法吗?谢谢!

0 投票
2 回答
1316 浏览

r - Melt and dcast based on the name of the original data frame column

I'm having a hard time reshaping a dataframe for use with error bar plots, combining all the columns with centeral-tendency data and, separately, all the columns with error data.

I start with a data frame with a column for the independent variable, and then two columns for each measured parameter: one for the average value, and one for the error, as you'd typically format a spreadsheet with this kind of data. The initial data frame looks like this:

I'd like to use melt and dcast to get it into a form that looks like this:

So that I can then feed it to ggplot like this:

I've been trying to melt and then recast using expressions like this:

but these return a dataframe with funny boolean columns.

I could manually make two dataframes (one for the mean values, one for the errors), melt them separately, and recombine, but surely there must be a more elegant way?

0 投票
2 回答
182 浏览

r - 是否已经有一个函数可以在随后的季度中减去不同的变量?

我有一个缺失值的不平衡季度面板数据集。我想A2A1后续季度中减去变量。请注意,我不想得到 A2 的差异,而是从彼此中减去不同的变量。应为每个 uid 分别计算差异。除了像 1999 年第 4 季度和 2000 年第 1 季度这样的变化年份之外,还意味着随后会发生变化。

我真的不确定我是否应该在这里连接我的时间索引,因为像 zoo 这样的包只需要一个索引。但这不是这里的问题。这是一些示例数据:

如果您更喜欢分隔索引,请使用以下示例:

有没有一个很好的方法来解决这个问题reshape2plyr甚至是 base 还是你更愿意编写一个自定义函数?

请注意,也有可能uid只出现一次。显然,您无法计算滞后差异。我仍然需要检查并创建一个 NA 。