问题标签 [melt]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 R 中使用 reshape2 重塑数据
我一直在试图弄清楚 melt 和 cast 功能如何与 reshape2 包一起使用。但无法得到我正在寻找的结果。
数据如下:
这是我想要达到的目标
我想转置数据,以便“期间”成为自己的一列。足够的代码来实现这一点将不胜感激!
更新
这就是我的数据的样子:
这就是我想要实现的目标:
r - R - 将 3 小时的区块数据聚合成每周(融化)
我正在尝试从美国的全球循环模型 (GCM) 中计算最大值、最小值和平均值。2026-2045 和 2081-2100 的数据以 3 小时为单位。
样本数据:
我已经通过 FIPS 代码提取了数据,并使用melt()
;重塑了年度数据文件。
我使用以下代码添加了日期字符串和工作日:
插入日期变量
插入日变量
我的目标是将这些 3 小时一次的块聚合为每周数据,但是 GCM 数据并不一致,块在 7 到 8 之间变化。我想将数据剪辑为从 2026 年的第一个星期一开始到最后一个星期日结束2045,然后使用 rep() 为整个纪元分配周数。
我知道我可以用这样的东西来计算每天的次数;
其中 0、1、2...、6 代表星期日、星期一、...
我的问题是我在尝试聚合数据时做错了什么?但重要的是,我将不胜感激将数据集剪辑为从第一个星期一开始到最后一个星期日结束。非常感谢!
python - Python - 获取一个以时间为索引,以多个日期为列的数据框
我想我需要一些关于“融化”功能的帮助。
我有一个如下所示的数据框:
如您所见,当前索引是时间。
但是,如果想实现以下目标:
背后的理由是我想比较不同日子同一季度的 RZS 值。
我知道我可以使用 melt 功能,但我不知道这个功能是如何工作的......
它创建了数据框,但我不知道如何填充它。我的问题:
- 创建包含一天所有 96 个季度的索引的最简单方法是什么?
- 如何使用 melt 功能填充新的 df?
非常感谢您提前。
r - 在 R 中格式化数据框
我有一个相当复杂的任务需要执行,所以请耐心等待。我猜这是可能的,但如果没有,请告诉我。
假设我有以下数据
这个数据的问题是变量名占用了一列。我想为Number of Shoes
and创建两列Number of Coins
,但我想确保日期保持不变。理想情况下,我想把这个数据框变成这个
因此,日期范围将是每个变量的最小日期到每个变量的最大日期。这将产生对 NA 的需求。我想在每个name
. 希望这是有道理的!
r - R - 熔化两个地址列并转换为新列
我在数据框中有两列代表地址。我需要将两者融合并重铸为单列,并且无法将我的头缠绕在 reshape2 周围。例子:
我需要这个作为输出
编辑:让我更具体一点:顺序无关紧要,我正在工作的数据框中有很多列,而不仅仅是需要合并的两列。如果可以创建一个新的、单独的数据框,该数据框是一个包含来自地址列 1 (A) 和地址列 2 (B) 的所有数据的单列,那就太好了。地址(显然)需要以其当前形式保存。给出的一些答案是以确实解决此问题的方式将数据混合在一起。
r - 复杂的子集数据集到数据框
1)我想在 Gnu R 中使用此处的数据集进行子集操作,以生成仅包含巴西、时间和有关收入份额的所有系列名称的结果数据框(例如“最低 10% 持有的收入份额”、“ “Income share by minimum 20%”等)。总共会有7个关于Income Share的系列名称。
我尝试了以下命令,但不能子集多个“Series.Name”:
2)在第二步中,我想删除所有具有 NA 值的行。
我使用的完整代码如下:
r - 使用自定义 fun.aggregate 进行 dcast
我的数据如下所示:
我添加了额外的列:
我使用 dcast 重新格式化了我的数据:
所以我的新数据如下所示:
这是我想要的正确数据格式,但我想以不同的方式进行 fun.aggregate。相反,我想取一个加权平均值,覆盖率按长度加权:
(总和(ct_lt))/(总和(长度))
我该怎么做呢?
r - 如何将数据框融合为多个因素
我一直在尝试用 ggplot 绘制线图。
我的数据看起来像这样:
并且可以在这里找到。
CAT
基本上,我们最初在一年中有一定数量的s(或其他生物)(这是 ),而在年底I04
有一定数量的s(这是)。这种情况持续了一段时间。 CAT
F04
我可以使用下面的代码相当简单地绘制这样的东西,并得到这个:
这太棒了,但对我来说效果不佳。毕竟,我每年都有这些盯着和结束的库存。所以我有兴趣了解初始值 ( I04, I05, I06
) 如何随时间变化。因此,对于每种动物,我想创建两条不同的线,一条用于初始数量,一条用于最终数量 ( F01, F05, F06
)。在我看来,现在我必须考虑两个因素。
考虑到我的数据设置方式,这真的很难。我不确定如何告诉 ggplot 所有I
前缀年份都是一个因素,所有F
前缀年份都是另一个因素。当数据框融化时,为时已晚。我不确定如何控制这种情况。
关于如何区分这些值或解决这种情况的另一种更好的方法的任何建议?
这是我的代码:
r - 具有独特组合的 R tcrossprod
可能有一个版本的 tcrossprod 可以实现这一点,但我找不到它。从下面的示例中,如果顺序无关紧要,如何仅获取第一次出现组合的行?即(1,2)对我来说与(2,1)相同。
r - bioclim 数据的绘图线跨月
我有 28 个位置的温度和降水的平均 bioclim 值(如下面的数据集),我想绘制连接每个数据点每个月平均值的线(即所有月份每个位置的一条线)。
这给了我每个月所有点的一条垂直线:
****我发现这是最直接的解决方案。