繁体   English   中英

在Matlab中分组以查找产生最小值的值,类似于SQL

[英]group by in Matlab to find the value that resulted minimum similar to SQL

我有一个具有a,b,c和d列的数据集,我想按a,b分组该数据集,并找到c,使得每个组的d最小,我可以使用'grpstats'进行“ group by”:

grpstats(M,[M(:,1)M(:,2)],{'min'});

我不知道如何找到导致d中的最小值的M(:,3)的值

在SQL中,我想为此使用嵌套查询并使用主键。 如何在Matlab中解决?

这是一个例子:

>> M =[4,1,7,0.3;
2,1,8,0.4;
2,1,9,0.2;
4,2,1,0.2;
2,2,2,0.6;
4,2,3,0.1;
4,3,5,0.8;
5,3,6,0.2;
4,3,4,0.5;]

>> grpstats(M,[M(:,1) M(:,2)],'min')
ans =

2.0000    1.0000    8.0000    0.2000
2.0000    2.0000    2.0000    0.6000
4.0000    1.0000    7.0000    0.3000
4.0000    2.0000    1.0000    0.1000
4.0000    3.0000    4.0000    0.5000
5.0000    3.0000    6.0000    0.2000

但是M(1,3)和M(4,3)是错误的。 我正在寻找的正确答案是:

2.0000    1.0000    9.0000    0.2000
2.0000    2.0000    2.0000    0.6000
4.0000    1.0000    7.0000    0.3000
4.0000    2.0000    3.0000    0.1000
4.0000    3.0000    4.0000    0.5000
5.0000    3.0000    6.0000    0.2000

总而言之,我不要第三栏的最小值。 但我希望它的值对应于第四栏中的最小值

我相信

temp = grpstats(M(:, [1 2 4 3]),[M(:,1) M(:,2) ],{'min'});
result = temp(:, [1 2 4 3]);

会满足您的要求。 如果没有,请在评论中说明,我们可以找出答案...

如果我正确理解文档,甚至

temp = grpstats(M(:, [1 2 4 3]), [1 2], {'min'});
result = temp(:, [1 2 4 3]);

应该工作(给出列号而不是列的全部内容)...目前无法测试,因此无法保证。

grpstats不会做到这一点,而且MATLAB并没有像您希望的那样使它变得如此简单。

有时蛮力是最好的,即使它看起来不像是很棒的MATLAB风格:

[b,m,n]=unique(M(:,1:2),'rows');
for i =1:numel(m)
    idx=find(n==i);
    [~,subidx] = min(M(idx,4));
    a(i,:) = M(idx(subidx),3:4);
end

>> [b,a]
ans =
        2            1            9          0.2
        2            2            2          0.6
        4            1            7          0.3
        4            2            3          0.1
        4            3            4          0.5
        5            3            6          0.2

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM