PostgreSQL多个pg_trgm相似度得分子查询

Question

我对SQL还是很陌生，并且正努力处理子查询。 我有一张桌子，看起来像这样：

      sss        | mm | sid 
------------------+----+-----
IBM LTD          |    | 003
I.B.M.           |    | 003
A.BM LTD         |    | 004
IMB LTD          |    | 004
IMB UK           |    | 005
IBMUK LTD        |    | 006
IBMUKLTD         |    | 007
IBM LIMITED      |    | 008
IBM U.K.         |    | 008
IBM U.K. LIMITED |    | 009
I.B.M UK LTD     | 1  | 001
IBM              | 1  | 001
IBM UK           | 1  | 001
IBM UK LTD       | 1  | 001

mm列中带有1的行是手动匹配的行，并且ID是正确的。 我想使用similarity函数尝试查找与已手动匹配的记录的紧密匹配。

我知道通常您会在from语句中放置一个子查询，但是我无法使用similarity函数来执行此操作，但是我不确定该怎么做，这就是我想做的事情：

SELECT 
    sss, 
    similarity(sss, select(sss from tusm where mm = 1) as match_score)
from 
    tusm 
where 
    mm is null and
    where match_score >= 0.5
;

Answer 1

您在这里遇到一些问题。 您不能在where子句中使用列别名，而是试图在括号的错误一侧分配列别名，不能将集合提供给similarity的第二个参数，并且通常只对语法在几个地方。

要克服similarity无法处理集合的问题，请执行自我连接：

select a.sss as a_sss, b.sss as b_sss, similarity(a.sss, b.sss) as score from
tusm a, tusm b 
where a.mm is null and b.mm = 1 and 
similarity(a.sss, b.sss)  > 0.5;

给

   a_sss   |   b_sss    |  score
-----------+------------+----------
 IBM LTD   | IBM UK LTD | 0.727273
 IBMUK LTD | IBM UK LTD | 0.615385

如果表变大，将很难使其性能良好。

PostgreSQL多个pg_trgm相似度得分子查询

问题描述

1 个解决方案

解决方案1
2 已采纳 2015-06-12 22:00:54

PostgreSQL多个pg_trgm相似度得分子查询

问题描述

1 个解决方案

解决方案1 2 已采纳 2015-06-12 22:00:54

解决方案1
2 已采纳 2015-06-12 22:00:54