繁体   English   中英

在 mysql 中创建一个与 GROUP BY 一起使用的用户定义函数

[英]Create a user defined function that works with GROUP BY in mysql

我正在尝试在 MySQL 中创建一个聚合函数 MEDIAN(),如 MIN()、MAX()、AVG(),它接受输入的列名或字符串,该列名或字符串连接了所需列的值。

我在理解 MySQL 自定义函数的局限性时遇到了麻烦,如果有人可以帮助我了解这是如何完成的,那将会非常有帮助。

例子:

MySQL 表有 2 列 (ID, num)

+----+-----+
| id | num |
+----+-----+
|  1 |   5 |
|  1 |   6 |
|  1 |   7 |
|  2 |   1 |
|  2 |   3 |
|  2 |   5 |
+----+-----+

SELECT id, MEDIAN(num) as median
FROM table
GROUP BY id;

或者

SELECT id, MEDIAN(GROUP_CONCAT(num SEPARATOR ',') as median
FROM table
GROUP BY id;

预期输出为

+----+--------+
| id | median |
+----+--------+
|  1 |      6 |
|  2 |      3 |
+----+--------+

MariaDB-10.3.3 中添加了 用户定义的聚合存储函数

MySQL 可以执行聚合函数,但不能在 SQL 中执行。 他们需要一个UDF(共享库实现)

没有 UDF 也是可能的,我知道有两种方法可以做到。 第一个使用两个选择和一个连接,第一个选择获取值和排名,第二个选择获取计数,然后连接它们。 第二个使用 json 函数在一次选择中获取所有内容。 它们都有点冗长,但它们工作并且相当快。

解决方案#1(两个选择和一个连接,一个获得计数,一个获得排名)

SELECT  x.group_field, 
        avg(
            if( 
                x.rank - y.vol/2 BETWEEN 0 AND 1, 
                value_field, 
                null
            )
        ) as median
FROM (
    SELECT  group_field, value_field, 
            @r:= IF(@current=group_field, @r+1, 1) as rank, 
            @current:=group_field
    FROM (
        SELECT group_field, value_field
        FROM table_name
        ORDER BY group_field, value_field
    ) z, (SELECT @r:=0, @current:='') v
) x, (
    SELECT group_field, count(*) as vol 
    FROM table_name
    GROUP BY group_field
) y WHERE x.group_field = y.group_field
GROUP BY x.group_field;

解决方案 #2(使用 json 对象来存储计数并避免连接)

SELECT group_field, 
    avg(
        if(
            rank - json_extract(@vols, path)/2 BETWEEN 0 AND 1,
            value_field,
            null
        )
    ) as median
FROM (
    SELECT group_field, value_field, path, 
        @rnk := if(@curr = group_field, @rnk+1, 1) as rank,
        @vols := json_set(
            @vols, 
            path, 
            coalesce(json_extract(@vols, path), 0) + 1
        ) as vols,
        @curr := group_field
    FROM (
        SELECT p.group_field, p.value_field, concat('$.', p.group_field) as path
        FROM table_name
        JOIN (SELECT @curr:='', @rnk:=1, @vols:=json_object()) v
        ORDER BY group_field, value_field DESC
    ) z
) y GROUP BY group_field;

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM