1

我正在新墨西哥州处理气候数据,我是一名 R 新手。我正在尝试用手段替换 NA,但我的 df 中有 37 个不同的站点。我想要 DF$STATION.NAME (在第 1 列中)唯一的列的方法。我不能使用来自一个位置的数据来找到另一个位置的平均值......显然。所以我真的应该为每个月、每个站点设置一个平均值。

我的数据按第 1 列中的 station.name 垂直组织,并在随后的列中按 jan-dec 月份的读数进行组织,包括末尾的总列(右)。读数或观测值是每个月的每个台站,在几年内(台站名称在每个新年的新行中列出。)

我需要用给定 station.name 中给定月份的 CLDD 总和替换 NA,我该怎么做?

4

1 回答 1

0

尝试在https://stats.stackexchange.com/上问这个问题(如标签所建议的那样),那里的 R 用户可能比一般编程网站上的多。我还在您的问题中添加了标签。

将您的数据拆分为站月子集,在那里填充缺失值,然后将它们重新组合成一个大矩阵,这并没有错!

另请参阅: 替换 R 中缺失值的均值或模式

请注意,使用均值、中位数或众数填充缺失值的常见做法很流行,但可能会稀释您的结果,因为这显然会减少方差。除非你有一个强有力的物理论据,为什么以及如何插入缺失值,否则如果你能找到一种可以直接处理缺失值的方法会更优雅。

于 2012-09-19T06:04:56.880 回答