0

我有一个包含 a、b、c 和 d 列的数据集我想按 a、b 对数据集进行分组并找到 c 使得每个组的 d 最小我可以使用“grpstats”进行“分组”:

grpstats(M,[M(:,1) M(:,2) ],{'min'});

我不知道如何找到导致 d 中最小值的 M(:,3) 的值

在 SQL 中,我想我们为此使用嵌套查询并使用主键。在matlab中怎么解决?

这是一个例子:

>> M =[4,1,7,0.3;
2,1,8,0.4;
2,1,9,0.2;
4,2,1,0.2;
2,2,2,0.6;
4,2,3,0.1;
4,3,5,0.8;
5,3,6,0.2;
4,3,4,0.5;]

>> grpstats(M,[M(:,1) M(:,2)],'min')
ans =

2.0000    1.0000    8.0000    0.2000
2.0000    2.0000    2.0000    0.6000
4.0000    1.0000    7.0000    0.3000
4.0000    2.0000    1.0000    0.1000
4.0000    3.0000    4.0000    0.5000
5.0000    3.0000    6.0000    0.2000

但是 M(1,3) 和 M(4,3) 是错误的。我正在寻找的正确答案是:

2.0000    1.0000    9.0000    0.2000
2.0000    2.0000    2.0000    0.6000
4.0000    1.0000    7.0000    0.3000
4.0000    2.0000    3.0000    0.1000
4.0000    3.0000    4.0000    0.5000
5.0000    3.0000    6.0000    0.2000

总而言之,我不想要第三列的最小值;但我希望它的值对应于第 4 列中的最小值

4

2 回答 2

0

我相信

temp = grpstats(M(:, [1 2 4 3]),[M(:,1) M(:,2) ],{'min'});
result = temp(:, [1 2 4 3]);

会做你需要的。如果没有,请在评论中解释,我们可以解决...

如果我正确理解文档,即使

temp = grpstats(M(:, [1 2 4 3]), [1 2], {'min'});
result = temp(:, [1 2 4 3]);

应该可以工作(给出列号而不是列的全部内容)......现在无法测试,所以不能保证。

于 2013-09-04T04:44:46.540 回答
0

grpstats不会这样做,而且 MATLAB 也不会像您希望的那样简单。

有时蛮力是最好的,即使它感觉不像 MATLAB 风格:

[b,m,n]=unique(M(:,1:2),'rows');
for i =1:numel(m)
    idx=find(n==i);
    [~,subidx] = min(M(idx,4));
    a(i,:) = M(idx(subidx),3:4);
end

>> [b,a]
ans =
        2            1            9          0.2
        2            2            2          0.6
        4            1            7          0.3
        4            2            3          0.1
        4            3            4          0.5
        5            3            6          0.2
于 2013-09-04T11:00:34.097 回答