MYSQL JOIN和GROUP / DISTINCT

Question

我要加入3个表，以了解特定区域中的用户。 这些表的缩小示例：

USER Table (stores all user information) 
ID | Name
----------
 1   John
 2   Joe
 3   Mike 

GEO (has all geo location info; including latitude and longitude; which im excluding for the example )
ID | CITY 
-------------
 1 | ORLANDO
 2 | MIAMI
 3 | DAYTONA

LOCATIONS (stores each users location; each user has multiple locations)
ID | AREA (id = user.id, geo = geo.id)
--------
 1 | 1
 1 | 2
 1 | 3
 2 | 1
 3 | 1
 3 | 3

我在php中创建了一个函数，以给定的LAT / LONG具有一定的半径来拉结果，如下所示（不包括不相关的整个函数）：

select USER.ID as USERID, (6371 * acos(cos(radians( {$lat})) * cos(radians(g.latitude)) * cos(radians(g.longitude) - radians({$long})) + sin(radians({$lat})) * sin(radians(g.latitude)))) AS distance
            from 
            GEO G 
            join LOCATIONS LOC on LOC.AREA = G.ID
            join USER U on LOC.ID = USERID
            HAVING distance <= {$radius}

现在的问题。 这有效并提取所有信息，但是由于该用户多次在LOCATIONS表中（即显示100个结果，其中15个不同的用户），导致多次显示同一用户

因此，我想到的是GROUP BY USER.id; 但这仅与该用户的第一个位置匹配； 仅产生2个结果。

我尝试过DISTINCT； 但各行之间没有区别，因为user.id或location.id是每行的不同组合。

我也尝试过向后处理子查询

SELECT * from USER where id = (
select id from GEO where area = (
select id, (long trig here) as distance) from GEO)

但这行不通，因为我必须选择trig语句作为距离，所以我不能只是从GEO表中选择id

我竭尽全力试图吸引唯一的用户； 但仍然可以在所有用户位置进行搜索。 我知道我可以在php中循环结果并重建它们； 但是，此查询很容易返回数千个结果，因为结果中显示了每个用户的位置，因此我不希望这样做是为了提高速度。

任何在正确方向上的帮助将不胜感激。

加成

为了详细说明结果，如果您在ORLANDO上以半径扩展到DAYTONA的方式运行此查询，则如果用户在DAYTONA中，则会得到提示

USER | CITY
-----------
 1  | ORLAND
 1  | DAYTONA
 2  | ORLANDO
 3  | ORLANDO
 3  | DAYTONA

导致用户1和3重复

但是当您按user.id分组时，您只会得到

 USER | CITY
-----------
 2  | ORLANDO

删除用户1和3，因为将用户1和3分组后仅将其区域显示为DAYTONA

Answer 1

如果使用WHERE ，而不是HAVING你将能够使用GROUP BY / DISTINCT ，赶上“M都喜欢这样：

SELECT u.id AS USERID
    FROM `GEO` g
    JOIN `LOCATIONS` l ON l.`AREA` = g.`ID`
    JOIN `USER` u ON l.`ID` = u.`ID`
    WHERE (6371 * ACOS(COS(RADIANS({$lat})) * COS(RADIANS(g.latitude)) * COS(RADIANS(g.longitude) - RADIANS({$long})) + SIN(RADIANS({$lat})) * SIN(RADIANS(g.latitude)))) <= {$radius}
    GROUP BY u.`ID`

这可以通过使用“早期”预聚合滤波器进行优化。 即，尽可能早地将WHERE应用于ON 。 尽管这看起来“怪异”，但速度可能会大大提高。 您的情况如下所示：

SELECT u.id AS USERID
    FROM `GEO` g
    JOIN `LOCATIONS` l ON 
        (6371 * ACOS(COS(RADIANS({$lat})) * COS(RADIANS(g.latitude)) * COS(RADIANS(g.longitude) - RADIANS({$long})) + SIN(RADIANS({$lat})) * SIN(RADIANS(g.latitude)))) <= {$radius}
        AND l.`AREA` = g.`ID`
    JOIN `USER` u ON l.`ID` = u.`ID`        
    GROUP BY u.`ID`

请注意，如果您也想选择距离，则仍然可以像以前一样将其放入选择字段列表中。 但是，就像使用DISTINCT您只会得到一个，而如果使用GROUP BY ，则可以将所有距离连接在一起
我建议您同时尝试GROUP BY 和 DISTINCT因为性能差异可能非常极端且不可预测。 （例如参见此问题）
只是想知道，但是预先计算诸如ACOS(COS(RADIANS({$lat}))零件而不是即时进行处理会更有效，有什么理由让它保持这样？
另外，您可能希望将长/纬度值存储在弧度中以进行进一步优化

MYSQL JOIN和GROUP / DISTINCT

问题描述

1 个解决方案

解决方案1
0 已采纳 2013-08-25 16:26:08

MYSQL JOIN和GROUP / DISTINCT

问题描述

1 个解决方案

解决方案1 0 已采纳 2013-08-25 16:26:08

解决方案1
0 已采纳 2013-08-25 16:26:08