matlab - 用其他行的平均值替换 nan 值

Question

考虑以下示例：

Jday = datenum('2007-01-01 00:00','yyyy-mm-dd HH:MM'):1:...
    datenum('2009-12-31 23:00','yyyy-mm-dd HH:MM');
Jday2 = datenum('2008-01-01 00:00','yyyy-mm-dd HH:MM'):1:...
    datenum('2010-12-31 23:00','yyyy-mm-dd HH:MM');

Data{1} = [Jday;1+(length(Jday)-1).*rand(1,length(Jday))]';
Data{2} = [Jday2;1+(length(Jday)-1).*rand(1,length(Jday))]';
Data{3} = [Jday;1+(length(Jday)-1).*rand(1,length(Jday))]';

for i = 1:length(Data);
    d_nan{i} = floor(1+(length(Jday)-1).*rand(1,100));
end

for i = 1:length(Data);
    a(i) = length(d_nan{i});
    for ii = 1:a(i);
        Data{i}(d_nan{i}(ii),2) = nan;
    end
end

在此示例中，我有一个单元格数组“数据”，其中包含三个单元格数组，每个单元格数组的第一列包含第二列中值的儒略日期。每个元胞数组中有许多 nan 值。我想用该特定朱利安日期的其他单元格中的值的平均值替换每个单元格数组中的 nan 值。我的问题很复杂，因为三个单元格没有同时显示数据（尽管 Data{1} 和 Data{3} 具有相同的日期。）如果三个单元格之间的儒略日期相同，则可以通过使用来解决此问题isnan 找到 nans 的位置，然后用其他行的 nanmean 替换这些行（在其他单元格中）。

任何人都可以提出解决这个问题的有效方法吗？感谢您的时间

score 1 · Accepted Answer

一个可能的解决方案是：

连接所有数据并定位NaN值：

D = [vertcat(Data{:})];
nanidx = find(isnan(D(:, 2)));

对于连接矩阵k中此类值的每个索引，查找具有相同日期的其他条目：NaND
```
entries = find(D(:, 1) == D(k, 1));
```

从这些条目中过滤掉非值，并用平均值NaN替换原来NaN的 at 位置：k

values = D(~isnan(D(entries, 2)) & ~ismember(entries, nanidx), 2);
D(k, 2) = mean(values);

将所有内容转换回元胞数组：

Data = mat2cell(D, cellfun('length', Data), 2)';

这是最终的、复制粘贴友好的代码：

D = [vertcat(Data{:})];
nanidx = find(isnan(D(:, 2)));
for k = transpose(nanidx(:))
    entries = find(D(:, 1) == D(k, 1));
    values = D(~isnan(D(entries, 2)) & ~ismember(entries, nanidx), 2);
    D(k, 2) = mean(values);
end
Data = mat2cell(D, cellfun('length', Data), 2)';

score 0 · Accepted Answer

这可能会解决您的问题，尽管它并不完全符合您的要求。在每个 NaN 值处，它用当天插值的平均值替换它，并从插值中删除 NaN。

for i = 1:3
    for j = 1:length(Jday)
        if isnan(Data{i}(j,2))
            d = Data{i}(j,1);
            Data{i}(j,2) = mean([ ...
                interp1(Data{1}(find(~isnan(Data{1}(:,2))),1),Data{1}(find(~isnan(Data{1}(:,2))),2),d) ...
                interp1(Data{2}(find(~isnan(Data{2}(:,2))),1),Data{2}(find(~isnan(Data{2}(:,2))),2),d) ...
                interp1(Data{3}(find(~isnan(Data{3}(:,2))),1),Data{3}(find(~isnan(Data{3}(:,2))),2),d)]);
        end
    end
end

score 0 · Accepted Answer

不确定您是否看到了编辑（我是新用户，所以仍在学习它是如何工作的），所以这里有一个解决方案，可以满足您的要求，并将 NaN 留在其他两个没有相同日期的地方。

for i = 1:3
    for j = 1:length(Jday)
        if isnan(Data{i}(j,2))
            d = Data{i}(j,1);
            if (~isempty(find(Data{:,1}==d,1)) && ...
                ~isempty(find(Data{:,2}==d,1)) && ...
                ~isempty(find(Data{:,3}==d,1)))
                Data{i}(j,2) = nanmean([ ...
                    Data{1}(find(Data{:,1}==d,1),2) ...
                    Data{2}(find(Data{:,2}==d,1),2) ...
                    Data{3}(find(Data{:,3}==d,1),2) ]);
            end
        end
    end
end

matlab - 用其他行的平均值替换 nan 值

3 回答 3

Related

Reference