获取每组 SQL 的第一行

Question

我有如下数据。 我想从以下数据中得到每个性别的首选

subjectID <- c("1", "2", "1", "0", "1", "0", "0", "1", "0", "2", 
       "0", "0", "2", "2","2","1","2","1","0","2")
gender <- c("M", "M", "F", "M", "M", "F", "M", "M", "M", "F", 
    "M", "F", "M", "M", "F","M", "F", "M", "F",  "F")

 selection <- data.frame(subjectID, gender)
       subjectID <- c("1", "2", "0")
       subject <- c("Maths", "Music",  "English")

    subjects <- data.frame(subjectID, subject)

我尝试按如下降序映射选项：

 favourite <- sqldf("SELECT  a.gender, b.subject, COUNT(a.subjectID) as `no of selections`
              FROM selection a
              JOIN subjects b
              ON (a.subjectID  = b.subjectID )
              GROUP BY a.subjectID, a.gender
              ORDER BY a.gender, `no of selections` DESC
              ")

但是，我想得到下表，在那里我得到每个性别的首选：

gender <- c("F", "M")
subjects <- c("Music", "Maths")
mostfav <- data.frame(gender, subjects)

Answer 1

如果我理解正确，您可以在 SQL 中使用窗口函数：

SELECT gs.*
FROM (SELECT s.gender, su.subject, COUNT(*) as cnt,
             ROW_NUMBER() OVER (PARTITION BY s.gender ORDER BY COUNT(*) DESC) as seqnum
      FROM selection s JOIN
           subjects su
           ON su.subjectID  = s.subjectID
      GROUP BY s.gender, su.subject
     ) gs
WHERE seqnum = 1;

Answer 2

如果您运行的是 MySQL 8.0，您可以在子查询中使用RANK()按每个性别的主题计数对记录进行排名，并在外部查询中过滤每个组的最高记录（如果有最高关系， RANK()保留他们）：

SELECT gender, subject, no_of_selections
FROM (
    SELECT  
        se.gender, 
        su.subject, 
        COUNT(*) as no_of_selections,
        RANK() OVER(PARTITION BY se.gender ORDER BY COUNT(*) DESC) rn
    FROM selection se
    JOIN subjects su ON se.subjectID  = su.subjectID
    GROUP BY se.subjectID, se.gender, su.subject
) t
WHERE rn = 1
ORDER BY gender DESC

在早期版本中，在窗口功能都没有速效，一个选择是过滤器一个having子句返回到每性别顶部数：

SELECT  
    se.gender, 
    su.subject, 
    COUNT(*) as no_of_selections
FROM selection se
JOIN subjects su ON se.subjectID  = su.subjectID
GROUP BY se.subjectID, se.gender, su.subject
HAVING COUNT(*) = (
    SELECT COUNT(*) 
    FROM selection se1
    WHERE se1.gender = se.gender
    GROUP BY se1.subjectID, se1.gender
    ORDER BY COUNT(*) DESC
    LIMIT 1
)

笔记：

我更改了表别名以使它们更有意义
您应该将subject列添加到GROUP BY子句中，以使您的查询可在 sql 模式ONLY_FULL_GROUP_MODE下运行，默认情况下从 MySQL 5.7 开始启用

获取每组 SQL 的第一行

问题描述

2 个解决方案

解决方案1
1 2020-03-01 18:57:24

解决方案2
1 已采纳 2020-03-01 19:15:50

获取每组 SQL 的第一行

问题描述

2 个解决方案

解决方案1 1 2020-03-01 18:57:24

解决方案2 1 已采纳 2020-03-01 19:15:50

解决方案1
1 2020-03-01 18:57:24

解决方案2
1 已采纳 2020-03-01 19:15:50