繁体 English 中英

如何使用 hive 简化计算效率？

[英]how to simplified the calculate efficiency with hive?

原文 2018-03-01 02:48:31 3 1 sql/ database/ hive/ pyspark

代码在 hive 上运行：

select day,count(mdn)*5 as number from
(select distinct a.mdn,a.day from 
flow a
left outer join
flow b
on a.day=date_add(b.day,-1) and a.mdn=b.mdn
left outer join
flow c
on a.day=date_add(c.day,-2) and a.mdn=c.mdn
left outer join
flow d
on a.day=date_add(d.day,-3) and a.mdn=d.mdn
where b.mdn is null  and c.mdn is null  and d.mdn is null)t 
group by day

代码的逻辑是选择今天三天内没有出现的一个mdn，然后计算mdn的个数。但是这个代码的效率太低了，因为3次join同一个大表流。 如何高效地简化它？

1 个解决方案

好吧，您可以使用lead()查看第二天并比较日期时间：

select f.*
from (select f.*,
             lead(f.day) over (partition by f.mdn order by f.day) as next_day
      from flow f
     ) f
where next_day > date_add(day, 3) or next_date is null;

如何用 MySQL 计算效率

[英]How to calculate efficiency with MySQL

如何在蜂巢中计算累计薪水

[英]how to calculate cumulative salary in hive

如何计算HIVE / HUE中的生日？

[英]How to calculate birthdays in HIVE/HUE?

Hive查询效率

[英]Hive Query Efficiency

Hive case when 子句效率

[英]Hive case when clause efficiency

如何使用 Hive 中的月份计算某个日期

[英]How to calculate certain date using month in Hive

如何计算蜂巢0-1序列的时间长度？

[英]how to calculate the time length of 0-1 sequence with hive?

SQL / HIVE：如何计算购买天数

[英]SQL/HIVE : How to calculate days to purchase

比较 Hive 查询与不同连接顺序的效率

[英]Comparing efficiency of Hive queries with different join orders

比较hive表时如何计算记录的百分比？

[英]How to calculate the percentage of records when comparing hive tables?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何用 MySQL 计算效率如何在蜂巢中计算累计薪水如何计算HIVE / HUE中的生日？ Hive查询效率 Hive case when 子句效率如何使用 Hive 中的月份计算某个日期如何计算蜂巢0-1序列的时间长度？ SQL / HIVE：如何计算购买天数比较 Hive 查询与不同连接顺序的效率比较hive表时如何计算记录的百分比？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM