“reshape”的相关标签问题_Stack Overflow中文网

0 投票

4 回答

666 浏览

r - 如何根据R中识别向量的元素为数据框分配重复次数？

我有一个数据框，其中的个人分配了一个文本 id，该文本 id 将地名与个人 id 连接起来（参见下面的数据）。最终，我需要将数据集从“长”转换为“宽”（例如，使用“重塑”），以便每个人只包含一行。为了做到这一点，我需要分配一个“时间”变量，reshape 可以使用它来识别随时间变化的协变量等。我有（可能是坏的）代码来为重复最多两次的个人执行此操作，但需要能够识别多达 18 次重复出现。如果我删除哈希前面的行，下面的代码可以正常工作，但最多只能识别两次重复。如果我把那条线留在里面（这对于重复两次以上的人来说似乎是必要的），R 会窒息，

有人能帮忙吗？提前致谢！

2011-10-06T01:39:36.043

0 投票

3 回答

2419 浏览

r - 使用 plyr 改善基于重塑的习惯：melt/cast 与 ddply

我有点习惯了，melt而且cast这一次我正在寻找整洁的单线。

这是可能的ddply吗？我很渴望单线。我试过：

当然，这是可行的，但不是通过hp和cyl总结am。我已经有一段时间没有使用了plyr，reshape所以我有点失去了肌肉......所以......借口-moi pour une question triviale... =/

r aggregate-functions aggregation plyr reshape

2011-10-10T19:22:03.927

0 投票

2 回答

323 浏览

performance - 在 R 中加速将人重塑为周期格式的数据帧

我有一个数据集，其中包含面向人的格式的纵向数据，例如：

这会产生一个大型数据框，其中至少有 50k 个观测值和 90 个变量，最多可测量 29 个周期。

我想获得一个更面向周期的格式，例如：

我尝试了不同的方法来重塑数据框（*apply, plyr, reshape2, 循环，追加与预填充所有数字矩阵等），但似乎没有得到合适的处理时间（子集 +40 分钟）。在此过程中，我已经收集了各种关于要避免什么的提示，但我仍然不确定我是否错过了一些瓶颈或可能的加速。

是否有处理这种数据处理的最佳方法，以便我可以评估在纯 R 代码中可以实现的最佳处理时间？Stackoverflow 上也有类似的问题，但都没有给出令人信服的答案……

performance r reshape data-manipulation

2011-10-17T08:40:54.467

0 投票

2 回答

552 浏览

r - 如何将数据重塑为宽格式？

我有一个这样的数据集：

如何将这些数据重塑为宽格式？我试过这个

但这并没有给我正确的结果。正确的结果是：

r reshape

2011-10-17T09:49:06.110

0 投票

4 回答

56968 浏览

r - 将数据框重新排列到表格中，与“融化”相反

我有这样的巨大数据框：

我想“解开”到一个表，每个级别作为单列并填充 myvar：

我怎样才能做到这一点，我知道这是一个简单的问题，但我想不通。

r dataframe reshape

2011-10-19T20:37:40.740

0 投票

2 回答

4098 浏览

reshape - 在Stata中生成具有行中变量和列中给定变量的分位数的均值表

...并为差异和 t 统计量添加列。

我学会了如何通过分位数表制作分位数以及如何在此处添加一列/行差异（感谢@lejohn）。

现在，而不是将每一行作为一个变量的一个分位数，我希望每一行都是一个不同的变量，并且每个单元格将是每个变量的平均值，对于每个列中的个体来说，对于给定变量的分位数。

我可以使用轻松计算单元格条目tabstat，但我想要行中的变量和列中的分位数（tabstat产生转置）。我还希望能够区分列（如我的第一个问题）并计算单元格差异的 t 统计量。

我觉得中间步骤是reshape用三列长数据：id（这里是 acc_d）、变量名和变量值。但我无法弄清楚如何做到这一点，我可能会陷入 R 范式。

这是我想做的类型表的一个例子

在此处输入图像描述

这是我一直（不成功）修改的一些代码

谢谢！

reshape stata

2011-10-21T21:28:19.807

0 投票

3 回答

39298 浏览

r - 如何旋转/取消旋转（投射/融化）数据框？

如何“取消透视”表？什么是正确的技术术语？

更新：这个词叫做融化

我有一个国家数据框和每年的数据

我想要类似的东西

r pivot-table reshape reshape2

2011-11-02T12:08:46.017

0 投票

4 回答

1340 浏览

r - R重塑，按块重组数据帧

我正在尝试重塑数据框：

目前它看起来像这样：

我想要类似的东西：

（A1 和 B1 / A2 和 B2 是相同的变量（就内容而言），因此例如：A1 和 B1 都是测试 1 的结果的变量，而 A2 和 B2 都包含测试 2 的结果。所以为了评估它，我需要将Test1的所有结果放在一列中，将Test 2的所有结果放在另一列中。我试图用“melt”来解决这个问题，但它只是一个接一个地熔化数据帧，而不是块。（因为我需要保持前 2 列的原样，并且只重新排列最后 4 列，但作为三个块）还有其他想法吗？谢谢！

r dataframe reshape chunks data-management

2011-11-04T15:33:36.210

0 投票

2 回答

1316 浏览

r - Melt and dcast based on the name of the original data frame column

I'm having a hard time reshaping a dataframe for use with error bar plots, combining all the columns with centeral-tendency data and, separately, all the columns with error data.

I start with a data frame with a column for the independent variable, and then two columns for each measured parameter: one for the average value, and one for the error, as you'd typically format a spreadsheet with this kind of data. The initial data frame looks like this:

I'd like to use melt and dcast to get it into a form that looks like this:

So that I can then feed it to ggplot like this:

I've been trying to melt and then recast using expressions like this:

but these return a dataframe with funny boolean columns.

I could manually make two dataframes (one for the mean values, one for the errors), melt them separately, and recombine, but surely there must be a more elegant way?

r reshape

2011-11-09T10:49:27.750

0 投票

2 回答

182 浏览

r - 是否已经有一个函数可以在随后的季度中减去不同的变量？

我有一个缺失值的不平衡季度面板数据集。我想A2从A1后续季度中减去变量。请注意，我不想得到 A2 的差异，而是从彼此中减去不同的变量。应为每个 uid 分别计算差异。除了像 1999 年第 4 季度和 2000 年第 1 季度这样的变化年份之外，还意味着随后会发生变化。

我真的不确定我是否应该在这里连接我的时间索引，因为像 zoo 这样的包只需要一个索引。但这不是这里的问题。这是一些示例数据：

如果您更喜欢分隔索引，请使用以下示例：

有没有一个很好的方法来解决这个问题reshape2， plyr甚至是 base 还是你更愿意编写一个自定义函数？

请注意，也有可能uid只出现一次。显然，您无法计算滞后差异。我仍然需要检查并创建一个 NA 。

r plyr reshape

2011-11-10T11:50:42.147

问题标签 [reshape]

Reference