繁体   English   中英

Unnest 的 BigQuery 聚合问题

[英]BigQuery Aggregation Issues With Unnest

我遇到了一些我似乎无法破解的 BigQuery(提取 Google Analytics 数据)问题。 我很确定我已将其范围缩小到 UNNEST function 导致我的数据出现大量重复/过度聚合。

为此,我删除了 UNNEST function 和所有依赖它的东西,并提取相同的数据,它完全对齐。

这是我的查询,为了节省时间而进行了简化。 在这种情况下,我必须编辑“站点”案例声明以保持我的客户的匿名性,但 rest 保证它应该没问题,因为它不会拉动似乎破坏一切的特定节点。

“命中”表是导致问题的表。 为了我的目的,我只需要“hits.page.pagePath”列,但我无法弄清楚,对于我的生活,我做错了什么。 当我在没有 UNNEST function 或其依赖项的情况下运行查询时,一切都很好,而且我的数字看起来正确。 当我用这些运行它时,我得到的结果大约是这些数字的 20 倍。

任何帮助、想法、问题或建议将不胜感激。 谢谢!

SELECT 
     date,
    (CASE
        WHEN REGEXP_CONTAINS(h.page.pagePath,r'(?i)boots') THEN "Footwear | Boots"
        WHEN REGEXP_Contains(h.page.pagePath,r'(?i)clothing|(?i)lingerie|(?i)t-shirt|(?i)blouse|(?i)top') AND NOT REGEXP_CONTAINS(h.page.pagePath,r'(?i)active') THEN "Apparel"
        ELSE "Other"
    END) as Segment,
(CASE Statement to break out our sites) as Site,
    trafficSource.medium as Medium, 
    TRUNC(SUM(totals.totalTransactionRevenue)/1000000,2) as Revenue,
    SUM(totals.newVisits) as newUsers,
    SUM(totals.visits) as Sessions,
FROM 
        `GA_Table*`, UNNEST(hits) as h 
Group by date, Medium, Site, Segment
HAVING REGEXP_CONTAINS (trafficSource.medium,'cpc|organic') AND NOT REGEXP_Contains(trafficSource.medium,'social|fb_|insta|facebook_') AND NOT REGEXP_Contains(Site, 'Display') 
ORDER BY Site ASC, date ASC```


暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM