GROUP BY 与聚合和 INNER JOIN

Question

我试图尽可能地缩小问题的范围，它仍然是相当的。 这是无法按我想要的方式工作的查询：

SELECT *, MAX(tbl_stopover.dist)
FROM tbl_stopover
INNER JOIN
  (SELECT edges1.id id1, edges2.id id2, COUNT(edges1.id) numConn
  FROM tbl_edges edges1
  INNER JOIN tbl_edges edges2
  ON edges1.nodeB = edges2.nodeA
  GROUP BY edges1.id HAVING numConn = 1) AS tbl_conn
ON tbl_stopover.id_edge = tbl_conn.id1
GROUP BY id_edge

这是我得到的：

|id | edge | dist | id1 | id2 | numConn | MAX(tbl_stopover.dist) |
------------------------------------------------------------------
|2  | 23   | 2    | 23  | 35  | 1       | 9                      |
|4  | 24   | 5    | 24  | 46  | 1       | 9                      |
------------------------------------------------------------------

这就是我想要的：

|id | edge | dist | id1 | id2 | numConn | MAX(tbl_stopover.dist) |
------------------------------------------------------------------
|3  | 23   | 9    | 23  | 35  | 1       | 9                      |
|5  | 24   | 9    | 24  | 46  | 1       | 9                      |
------------------------------------------------------------------

但是让我详细说明一下...

我有一个图表，让我们这样说：

    node1
      |
    node2
   /     \
node3    node4
  |       |
node5    node6

因此，我有一张我称之为 tbl_edges 的表，如下所示：

| id  | nodeA | node B |
------------------------
| 12  |   1   |    2   |
| 23  |   2   |    3   |
| 24  |   2   |    4   |
| 35  |   3   |    5   |
| 46  |   4   |    6   |
------------------------

现在每条edge在一定距离处都有“ stop_over s”（到nodeA ）。 因此我有一个像这样的表 tbl_stopover：

| id  | edge  |  dist  |
------------------------
|  1  |  12   |    5   |
|  2  |  23   |    2   |
|  3  |  23   |    9   |
|  4  |  24   |    5   |
|  5  |  24   |    9   |
|  6  |  35   |    5   |
|  7  |  46   |    5   |
------------------------

为什么这个查询？
假设我想计算stop_over之间的距离。 在一个边缘内是没有问题的。 越过边缘变得更加困难。 但是如果我有两个连接的边并且没有其他连接，我也可以计算距离。 这是一个假设所有边的length为 10 的示例。：

边缘23在 dist=9 处具有 stop_over(id= 3 )，边缘35在 dist=5 处具有 stop_over(id= 6 )。 因此这两个stop_over之间的距离是：

dist = (length - dist_id3) + dist_id5 = (10-9) + 5

我不确定我是否说清楚了。 如果这不能理解，请随时提出问题，我会尽力使这更容易理解。

Answer 1

MySQL 允许您做一些愚蠢的事情 - 在聚合查询中显示不属于GROUP BY或聚合 function （如MAX ）的字段。 当你这样做时，你会得到剩余字段的随机结果（如你所说）。

在您的查询中，您执行了两次- 一次在您的内部查询中（ id2不是GROUP BY或聚合的一部分），一次在外部查询中。

准备随机结果！

要修复它，请尝试以下操作：

SELECT tbl_stopover.id,
       tbl_stopover.dist,
       tbl_conn.id1,
       tbl_conn.id2,
       tbl_conn.numConn,
       MAX(tbl_stopover.dist)
FROM tbl_stopover
INNER JOIN
  (SELECT edges1.id id1, edges2.id id2, COUNT(edges1.id) numConn
  FROM tbl_edges edges1
  INNER JOIN tbl_edges edges2
  ON edges1.nodeB = edges2.nodeA
  GROUP BY edges1.id, edges2.id
  HAVING numConn = 1) AS tbl_conn
ON tbl_stopover.id_edge = tbl_conn.id1
GROUP BY tbl_stopover.id,
         tbl_stopover.dist,
         tbl_conn.id1,
         tbl_conn.id2,
         tbl_conn.numConn

主要更改是显式字段列表（请注意，我删除了id_edge ，因为您正在加入id1并且已经拥有该字段），以及在内部和外部GROUP BY子句中添加了其他字段。

如果这为您提供了比您想要的更多的行，那么您可能需要更多地解释您想要的结果集。 这样的事情是确保您获得适当分组的唯一方法。

Answer 2

好的。 这似乎是我问题的答案。 不过，我会做一些进一步的“调查”，因为我不确定这是否可靠。 如果有人对此有所了解，请发表评论。

SELECT tbl.id, tbl.dist, tbl.id1, tbl.id2, MAX(dist) maxDist
FROM
(
  SELECT tbl_stopover.id,
         tbl_stopover.dist,
         tbl_conn.id1,
         tbl_conn.id2,
         tbl_conn.numConn
  FROM tbl_stopover
  INNER JOIN
    (SELECT edges1.id id1, edges2.id id2, COUNT(edges1.id) numConn
    FROM tbl_edges edges1
    INNER JOIN tbl_edges edges2
    ON edges1.nodeB = edges2.nodeA
    GROUP BY edges1.id
    HAVING numConn = 1) AS tbl_conn
  ON tbl_stopover.id_edge = tbl_conn.id1
  GROUP BY tbl_stopover.dist, tbl_conn.id1
  ORDER BY dist DESC) AS tbl
GROUP BY tbl.id1, tbl.id2

感谢JNK （我的同事），没有他我不会走到这一步。

GROUP BY 与聚合和 INNER JOIN

问题描述

2 个解决方案

解决方案1
4 2011-07-07 13:53:32

解决方案2
1 2011-07-07 15:49:45

GROUP BY 与聚合和 INNER JOIN

问题描述

2 个解决方案

解决方案1 4 2011-07-07 13:53:32

解决方案2 1 2011-07-07 15:49:45

解决方案1
4 2011-07-07 13:53:32

解决方案2
1 2011-07-07 15:49:45