簡體   English   中英

使用 Chinese_Hong_Kong_Stroke_90_CI_AS 排序規則時 SQL Server 中的模糊匹配

[英]Fuzzy match in SQL Server when using Chinese_Hong_Kong_Stroke_90_CI_AS collation

假設我們創建一個表如下:

create table my_table (
id int, 
city nvarchar(256) collate Chinese_Hong_Kong_Stroke_90_CI_AS)

INSERT INTO my_table (id, city)
VALUES (1, 'Shanghai');

INSERT INTO my_table (id, city)
VALUES (2, 'Shandong');

INSERT INTO my_table (id, city)
VALUES (3, 'Shanxi');

INSERT INTO my_table (id, city)
VALUES (4, 'Shaanxi');

my_table 現在有四條記錄:

id  city
1   Shanghai
2   Shandong
3   Shanxi
4   Shaanxi

以下 SQL 查詢返回相同的數字。 如何避免這個錯誤?

select top 1 id from my_table order by DIFFERENCE(city, 'Shanghai') desc
select top 1 id from my_table order by DIFFERENCE(city, 'Shandong') desc

另一個問題:

select top 1 id from my_table order by DIFFERENCE(city, 'Shannxi') desc 

當正確答案應該是 4 時返回 3。

該問題是由您的列的整理引起的。 根據文檔SOUNDEX & DIFFERENCE取決於排序規則。

一個可能的解決方案是:

select top 1 id
from my_table
order by DIFFERENCE(city collate SQL_Latin1_General_CP1_CI_AS, 'Shanghai') desc

select top 1 id
from my_table
order by DIFFERENCE(city collate SQL_Latin1_General_CP1_CI_AS, 'Shandong') desc

我想我會添加另一個帶有SQL_Latin1_General_CP1_CI_AS排序SQL_Latin1_General_CP1_CI_AS列,它存儲的值與city完全相同。

盡管確切地知道您要完成的工作會很有趣? 因為在您當前的校對中,這兩個詞顯然聽起來完全相同。

它也值得一讀Beyond SOUNDEX & DIFFERENCE

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM