[英]MYSQL JOIN and GROUP / DISTINCT
我要加入3个表,以了解特定区域中的用户。 这些表的缩小示例:
USER Table (stores all user information)
ID | Name
----------
1 John
2 Joe
3 Mike
GEO (has all geo location info; including latitude and longitude; which im excluding for the example )
ID | CITY
-------------
1 | ORLANDO
2 | MIAMI
3 | DAYTONA
LOCATIONS (stores each users location; each user has multiple locations)
ID | AREA (id = user.id, geo = geo.id)
--------
1 | 1
1 | 2
1 | 3
2 | 1
3 | 1
3 | 3
我在php中创建了一个函数,以给定的LAT / LONG具有一定的半径来拉结果,如下所示(不包括不相关的整个函数):
select USER.ID as USERID, (6371 * acos(cos(radians( {$lat})) * cos(radians(g.latitude)) * cos(radians(g.longitude) - radians({$long})) + sin(radians({$lat})) * sin(radians(g.latitude)))) AS distance
from
GEO G
join LOCATIONS LOC on LOC.AREA = G.ID
join USER U on LOC.ID = USERID
HAVING distance <= {$radius}
现在的问题。 这有效并提取所有信息,但是由于该用户多次在LOCATIONS表中(即显示100个结果,其中15个不同的用户),导致多次显示同一用户
因此,我想到的是GROUP BY USER.id; 但这仅与该用户的第一个位置匹配; 仅产生2个结果。
我尝试过DISTINCT; 但各行之间没有区别,因为user.id或location.id是每行的不同组合。
我也尝试过向后处理子查询
SELECT * from USER where id = (
select id from GEO where area = (
select id, (long trig here) as distance) from GEO)
但这行不通,因为我必须选择trig语句作为距离,所以我不能只是从GEO表中选择id
我竭尽全力试图吸引唯一的用户; 但仍然可以在所有用户位置进行搜索。 我知道我可以在php中循环结果并重建它们; 但是,此查询很容易返回数千个结果,因为结果中显示了每个用户的位置,因此我不希望这样做是为了提高速度。
任何在正确方向上的帮助将不胜感激。
加成
为了详细说明结果,如果您在ORLANDO上以半径扩展到DAYTONA的方式运行此查询,则如果用户在DAYTONA中,则会得到提示
USER | CITY
-----------
1 | ORLAND
1 | DAYTONA
2 | ORLANDO
3 | ORLANDO
3 | DAYTONA
导致用户1和3重复
但是当您按user.id分组时,您只会得到
USER | CITY
-----------
2 | ORLANDO
删除用户1和3,因为将用户1和3分组后仅将其区域显示为DAYTONA
如果使用WHERE
,而不是HAVING
你将能够使用GROUP BY
/ DISTINCT
,赶上“M都喜欢这样:
SELECT u.id AS USERID
FROM `GEO` g
JOIN `LOCATIONS` l ON l.`AREA` = g.`ID`
JOIN `USER` u ON l.`ID` = u.`ID`
WHERE (6371 * ACOS(COS(RADIANS({$lat})) * COS(RADIANS(g.latitude)) * COS(RADIANS(g.longitude) - RADIANS({$long})) + SIN(RADIANS({$lat})) * SIN(RADIANS(g.latitude)))) <= {$radius}
GROUP BY u.`ID`
这可以通过使用“早期”预聚合滤波器进行优化。 即,尽可能早地将WHERE
应用于ON
。 尽管这看起来“怪异”,但速度可能会大大提高。 您的情况如下所示:
SELECT u.id AS USERID
FROM `GEO` g
JOIN `LOCATIONS` l ON
(6371 * ACOS(COS(RADIANS({$lat})) * COS(RADIANS(g.latitude)) * COS(RADIANS(g.longitude) - RADIANS({$long})) + SIN(RADIANS({$lat})) * SIN(RADIANS(g.latitude)))) <= {$radius}
AND l.`AREA` = g.`ID`
JOIN `USER` u ON l.`ID` = u.`ID`
GROUP BY u.`ID`
DISTINCT
您只会得到一个,而如果使用GROUP BY
,则可以将所有距离连接在一起 GROUP BY
和 DISTINCT
因为性能差异可能非常极端且不可预测。 (例如参见此问题 ) ACOS(COS(RADIANS({$lat}))
零件而不是即时进行处理会更有效,有什么理由让它保持这样?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.