[英]Django & Postgres - percentile (median) and group by
我需要计算每个卖家 ID 的周期中位数(参见下面的简化模型)。 问题是我无法构建 ORM 查询。
模型
class MyModel:
period = models.IntegerField(null=True, default=None)
seller_ids = ArrayField(models.IntegerField(), default=list)
aux = JSONField(default=dict)
询问
queryset = (
MyModel.objects.filter(period=25)
.annotate(seller_id=Func(F("seller_ids"), function="unnest"))
.values("seller_id")
.annotate(
duration=Cast(KeyTextTransform("duration", "aux"), IntegerField()),
median=Func(
F("duration"),
function="percentile_cont",
template="%(function)s(0.5) WITHIN GROUP (ORDER BY %(expressions)s)",
),
)
.values("median", "seller_id")
)
我认为我需要做的是以下几行
select t.*, p_25, p_75
from t join
(select district,
percentile_cont(0.25) within group (order by sales) as p_25,
percentile_cont(0.75) within group (order by sales) as p_75
from t
group by district
) td
on t.district = td.district
Python 3.7.5、Django 2.2.8、Postgres 11.1
您可以像 Ryan Murphy ( https://gist.github.com/rdmurphy/3f73c7b1826cacee34f6c2a855b12e2e ) 所做的那样创建Aggregate
类的Median
子类。 Median
然后就像Avg
一样工作:
from django.db.models import Aggregate, FloatField
class Median(Aggregate):
function = 'PERCENTILE_CONT'
name = 'median'
output_field = FloatField()
template = '%(function)s(0.5) WITHIN GROUP (ORDER BY %(expressions)s)'
然后找到一个字段的中位数使用
my_model_aggregate = MyModel.objects.all().aggregate(Median('period'))
然后可用作my_model_aggregate['period__median']
。
这就是诀窍。
from django.db.models import F, Func, IntegerField
from django.db.models.aggregates import Aggregate
queryset = (
MyModel.objects.filter(period=25)
.annotate(duration=Cast(KeyTextTransform("duration", "aux"), IntegerField()))
.filter(duration__isnull=False)
.annotate(seller_id=Func(F("seller_ids"), function="unnest"))
.values("seller_id") # group by
.annotate(
median=Aggregate(
F("duration"),
function="percentile_cont",
template="%(function)s(0.5) WITHIN GROUP (ORDER BY %(expressions)s)",
),
)
)
请注意, median
注释使用Aggregate
而不是问题中的Func
。 此外, annotate() 和 filter() 子句的顺序以及 annotate() 和 values() 子句的顺序也很重要!
顺便说一句,生成的 SQL 没有嵌套的选择和连接。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.