问题标签 [reshape2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
6649 浏览

r - 根据另一列中的最大值选择一个值

我不明白为什么我找不到解决方案,因为我觉得这是一个非常基本的问题。那就需要求助了。我想按月重新排列空气质量数据集,每个月的最大温度值。另外我想找到每个月最高气温对应的日子。这样做的最懒惰(代码方面)的方法是什么?

我试过以下但没有成功:

我追求的是这样的:

0 投票
1 回答
96 浏览

r - 如何重塑列表中的 data.frames?

我有一个这样的清单

生产

现在我想像这样转置列表元素

但这会产生 a、b、cd 作为行名,这不是我想要的

我想在这些 data.frames 中为 a、b、c 和 d 生成一个新列。如何做到这一点?

0 投票
5 回答
13279 浏览

r - 使用VBA在excel中融化/重塑?

我目前正在适应一份新工作,我与同事分享的大部分工作都是通过 MS Excel 完成的。我经常使用数据透视表,因此需要“堆叠”数据,这正是我依赖的 R 中 (reshape2) 包中melt()函数的输出。reshape

任何人都可以让我开始使用 VBA 宏来完成此操作,或者是否已经存在?

宏的轮廓是:

  1. 在 Excel 工作簿中选择一系列单元格。
  2. 启动“融化”宏。
  3. 宏将创建一个提示“输入 id 列数”,您将在其中输入识别信息的前列数。(对于下面的示例 R 代码,它是 4)。
  4. 在 Excel 文件中创建一个名为“melt”的新工作表,用于堆叠数据,并创建一个名为“变量”的新列,该列与原始选择的数据列标题相同。

换句话说,输出看起来与在 R 中简单地执行这两行的输出完全相同:

这是一个例子:

0 投票
1 回答
1993 浏览

r - lm 拟合 data.frame 的多个子集

我正在运行一些模拟,我想将线性模型拟合到我的数据子集:

这行得通,但我想使用一种更简单的方法,首先为适合的数据创建一个新的 data.frame,

适合所有情况,

(这... | id显然是无效的语法)

并立即对完整数据使用预测,

有没有lm()像这样使用的技巧?还是更好的解决方案?谢谢。

0 投票
1 回答
218 浏览

r - 等效于使用强制转换的功能聚合语句

给我按月平均销售额的聚合函数工作正常。

...并产生以下输出:

我的理解是以下 cast 语句应该产生相同的输出:

而是返回以下错误:

我可能会遗漏一些东西,但是否可以在 cast 语句中使用 chronmonths() 调用?以下两个语句将在 cast() 中完成相同的操作,但我试图一步完成并更好地了解 cast 的工作原理。

提前致谢,--JT

0 投票
1 回答
681 浏览

r - ggplot、构面和系列中的颜色变化

我的传感器数据如下所示:

我想在单独的方面面板中创建两个折线图(chg 和总线对 tm)。扭曲的是,我还希望每条线都着色以表示它正在跟踪的电池。所以如果batt_A>0,它正在充电,我希望充电线是绿色的;如果batt_A==0,它在公共汽车上,我希望公共汽车线路是绿色的。batt_B 相同,除了线条是蓝色(或任何颜色)。

我得到了融化+刻面组合,但是如何添加颜色?

(ps:我正在使用构面,因为在同一时间尺度上还有 6 个传感器在变化,我想全部观看)

有了下面安德烈的回答,我得到了这个解决方案,但重新编码很可怕:

数据处理可以清理,但我想我在那里!

0 投票
2 回答
506 浏览

r - 整形台的性能

我怎样才能从这样的表中走出来:

对这样的人?我尝试使用 reshape2 包中的 dcast。它工作正常,但由于数据集很大,所以有点慢。有没有另一种方法可以更快地做到这一点?

谢谢!

0 投票
0 回答
2613 浏览

r - 大型数据集上的 reshape2 dcast 错误

我有一个包含大约 1,800,000 行的 search_query[factor]、movie_name[factor]、clicks[int] 列的数据集。当我使用 reshape2 包中的 dcast 函数尝试从搜索查询和电影名称创建矩阵时,以 click 作为值,我收到此错误:

如果我将数据子集为 100,000 行,那么我可以从 reshape2 包中运行 dcast 就好了。

电影的值为 69,598,点击值都是正数,没有 NA。运行 R 的 2.15.1 版本。

可能是什么问题,数据集是否太大?如果是这样,我怎样才能用这个数据集实现相同的结果?

提前非常感谢!

0 投票
3 回答
2466 浏览

r - POSIXct 值在 reshape2 dcast 中变为数字

我正在尝试使用最新包(1.2.1)中的 dcast 对 value.var 为 POSIXct 类型的数据框(或 data.table)进行非规范化,但在生成的数据框中,日期值已丢失他们的 POSIXct 类并变成数字。

如果我希望将值恢复为 POSIXct 的值,我真的必须 as.POSIXct() 每个生成的列,还是我遗漏了什么?

运行上述语句的结果(注意新列 c 和 d 是数字纪元秒而不是 POSIXct):

0 投票
2 回答
82 浏览

r - 对数据框进行长期到更广泛的重塑

我有以下格式的半长数据框:

...我想重塑为以下格式:

我一直在想,我应该能够做类似的事情:

但这并不完全正确。