[英]Fuzzy match on a left join
例如,我希望加入两个匹配率为 90% 的表。
以下面的示例为例,我想在电话号码上加入表 A 和表 B。 您可以看到电话号码略有不同(国际代码)。 我希望最终结果显示为表 C。
我想它会是这样的,但连接会指定匹配 90% 的phone_number
select
a.*,
b.most_recent_booking_date
from a
left join b
on a.phone_number = b.phone_number
希望这很清楚,任何帮助都会很棒! 干杯!
表 A
电话号码 | 最近通话日期 |
---|---|
441234567891 | 22 年 1 月 5 日 |
441234567892 | 02/05/22 |
表 B
电话号码 | 最近的预订日期 |
---|---|
+441234567891 | 22 年 3 月 5 日 |
+441234567892 | 22 年 4 月 5 日 |
表 C
电话号码 | 最近通话日期 | 最近的预订日期 |
---|---|---|
441234567891 | 22 年 1 月 5 日 | 22 年 3 月 5 日 |
441234567892 | 02/05/22 | 22 年 4 月 5 日 |
你可以尝试这样的事情,但我不喜欢它,因为 Demeteor 说你应该有一个 ID 才能加入。 请注意,我在这里使用左连接,以防表#T2 中没有数据。 我还在考虑一个计算列,它会删除 +,然后你也可以加入这种方式。 如果电话号码可能是狡猾的,我也会被告知 SQL 注入。
CREATE TABLE #T1 (
PhoneNumber VARCHAR(20) NOT NULL,
CallDate DATE NOT NULL
);
CREATE TABLE #T2 (
PhoneNumber VARCHAR(20) NOT NULL,
BookingDate DATE NOT NULL
);
INSERT INTO #T1 (PhoneNumber, CallDate)
VALUES
('441234567891', '20220501'),
('441234567892', '20220502');
INSERT INTO #T2 (PhoneNumber, BookingDate)
VALUES
('+441234567891', '20220503'),
('+441234567892', '20220504');
GO
SELECT *
FROM #T1 AS T1
LEFT JOIN #T2 AS T2 ON T2.PhoneNumber LIKE '%' + T1.PhoneNumber;
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.