如何加快 BigQuery 中的空间连接？

Question

我有一个 BigQuery 表，其中包含整个国家的点寄存器，我需要为它们中的每一个分配一个“人口统计区”，这些多边形包含在另一个表中。 我一直在尝试使用这样的查询来做到这一点：

SELECT id_point, code_censal_zone
    FROM `points_table`
    JOIN `zones_table`
    ON ST_CONTAINS(zone_polygon, point_geo)

第一个表非常大，因此查询执行效率非常低，因为它正在比较每个可能的 (point, censal zone) 对。 但是，这两个表都有一个列标识符，表示它们所在的自治市，所以问题是，可以以某种方式重写我的查询，即对属于相同的每个（点、人口普查区）对执行ST_CONTAINS(*)市，因此不比较每个点在国内所有可能的人口普查区？ 我可以这样做而不必多次阅读points_table吗？

SELECT id_point, code_censal_zone
    FROM `points_table`
    JOIN `zones_table`
    ON 1.municipality = 2.municipality
    AND ST_CONTAINS(zone_geo, point_geo)

我对 BigQuery 还是很陌生，所以我真的不知道这样的查询是否真的能达到我的预期，因为我在文档中找不到任何内容。

谢谢！

Answer 1

SELECT id_point, code_censal_zone
    FROM `points_table`
    JOIN `zones_table`
    ON 1.municipality = 2.municipality
    AND ST_CONTAINS(zone_geo, point_geo)

如何加快 BigQuery 中的空间连接？

问题描述

1 个解决方案

解决方案1
1 已采纳 2022-05-24 21:08:00

如何加快 BigQuery 中的空间连接？

问题描述

1 个解决方案

解决方案1 1 已采纳 2022-05-24 21:08:00

解决方案1
1 已采纳 2022-05-24 21:08:00