繁体   English   中英

比较字符串与mysql中的值

[英]Compare string with values from mysql

我有一个数据库,其中包含乐队和其他与音乐相关的艺术家的名字。 现在,我想针对此数据库检查包含艺术家名称的字符串,并找到相似或相等的艺术家,以避免不同种类的拼写。

我发现了php函数“ similar_text”,并且我敢肯定,构建一个脚本来在循环中进行此比较没有问题。

进行这种比较的最佳和最快方法是什么?

这取决于您的数据大小。 如果琐碎的事[几万]-然后每晚执行批处理作业,它将:

  • 从源数据中提取唯一的艺术家名称
  • 计算soundex
  • 创建密钥为soundex,值的字典-艺术家列的原始字符串列表

在此阶段,您必须决定是要自动合并还是手动批准每个重命名。 从长远来看,您可以使用带有正确拼写的帮助程序表,并且到目前为止可以找到错漏的拼写。 这些情况可以在下次遇到时自动处理。

如果soundex不够好,您可以尝试使用php的same_text,levenshtein函数,并将新添加的数据中找到的名称与您之前已经查看过的艺术家的“批准”名称进行比较。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM