如何根據其他列查找一列的不同

Question

我有一個如下數據框

col1    col2    col3
A       Z       10
A       Y       8
A       Z       15
B       X       11
B       Z       7
C       Y       10
D       Z       11
D       Y       14
D       L       16

我必須為每個distinct col1選擇col2哪個有max(col3)

輸出數據框應該是，

col1    col2    col3
A       Z       15
B       X       11
C       Y       10
D       L       16

如何在R或SQL執行此操作

提前致謝

Answer 1

我們可以使用data.table 。 我們將'data.frame'轉換為'data.table'（ setDT(df1) ），按'col1'分組，我們根據'col3'的最大值索引對data.table（ .SD ）進行子集化

library(data.table)
setDT(df1)[, .SD[which.max(col3)], col1]
#     col1 col2 col3
#1:    A    Z   15
#2:    B    X   11
#3:    C    Y   10
#4:    D    L   16

或者我們可以在使用'col1'分組后使用top_n的dplyr 。

library(dplyr)
df1 %>%
      group_by(col1) %>%
      top_n(1)

Answer 2

SQL答案：

如果沒有其他具有相同col1值且具有更高col3值的行，請使用NOT EXISTS返回行。

select *
from tablename t1
where not exists (select 1 from tablename t2
                  where t2.col1 = t1.col1
                    and t2.col3 > t1.col3)

如果有max（c3）平局，則返回col1的兩行。

Answer 3

另一種在MySQL中的做法。

這是SQLFiddle演示

輸出：=>

SELECT T1.*
FROM
table_name T1
INNER JOIN 
(SELECT col1,MAX(col3) AS Max_col3 FROM table_name GROUP BY col1) T2 
            ON T1.`col1` = T2.`col1` and T2.`Max_col3`=t1.`col3`

希望這可以幫助。

如何根據其他列查找一列的不同

問題描述

3 個解決方案

解決方案1
4 已采納 2015-11-18 10:12:52

解決方案2
3 2015-11-18 10:24:39

解決方案3
3 2015-11-18 10:44:44

如何根據其他列查找一列的不同

問題描述

3 個解決方案

解決方案1 4 已采納 2015-11-18 10:12:52

解決方案2 3 2015-11-18 10:24:39

解決方案3 3 2015-11-18 10:44:44

解決方案1
4 已采納 2015-11-18 10:12:52

解決方案2
3 2015-11-18 10:24:39

解決方案3
3 2015-11-18 10:44:44