繁体 English 中英

根据MongoDB中的字符串查找相似文档

[英]Find similar documents based on a string in MongoDB

原文 2022-04-24 09:29:32 1 1 javascript/ node.js/ database/ mongodb

我需要在 MongoDB 数据库中找到所有文档，这些文档的属性包含与搜索词相似但允许一定百分比差异的字符串。

例如，在普通的 javascript 中，我可以使用https://www.npmjs.com/package/string-similarity然后基本上匹配所有具有 > 90% 相似度分数的文档。

我想像 MongoDB 查询一样执行此操作，并尽可能提高性能，因为数据库包含数百万个文档。

在这种情况下我有什么可能的选择？

我找到了一些关于 $text search 的东西，但似乎没什么用
我正在考虑为每个文档创建某种签名，例如某种允许某种分歧的 hash。

我真的很高兴每一个想法都能以最好的方式解决这个问题。

1 个解决方案

这个问题的常见解决方案是使用搜索引擎数据库，例如Elasticsearch或Atlas search （由 Mongodb 团队提供）。 我不会 go 详细介绍这些数据库的工作原理，但一般来说它们是一个反向索引数据库，这意味着您在插入时对数据进行标记，然后查询在标记化数据上运行，而不是在原始数据集上运行。

这种方法非常强大，可以帮助解决许多“搜索引擎”问题，例如自动完成或在您的情况下称为“模糊”搜索。

让我们看看 elasticsearch 是如何通过阅读他们的模糊特征来处理这个问题的：

为了找到相似的术语，模糊查询会在指定的编辑距离内创建一组搜索术语的所有可能变体或扩展。 然后查询返回每个扩展的精确匹配。

基本上他们所做的是在给定参数内创建查询的所有“可能”排列。 我个人建议你只使用这些数据库中的一个提供这种能力的 OOTB，但是如果你想在 Mongo 中做一个“伪”搜索引擎，你可以使用这种方法（Mongo 索引的缺点是树，所以你强制对这些查询进行树扫描，而不是为此设计的数据库）

在Mongodb中查找基于Year的文档

[英]Find documents based on Year in Mongodb

在MongoDB中查找具有字符串ID数组的文档

[英]Find documents with array of string ID's in MongoDB

MongoDB-尝试基于查询字符串查找文档时，如何将.or转换为等效的聚合？

[英]MongoDB - How to convert .or to aggregate equivalent when trying to find documents based on a query string?

如何基于子字符串数组上的字符串匹配查找猫鼬文档

[英]How to find mongoose documents based on a string match on an array of substrings

MongoDB - 查找符合条件的文档

[英]MongoDB - find documents with couple conditions

使用 mongoose 查找 mongodb 中的文档

[英]Find documents in mongodb using mongoose

在 mongodb 中找不到嵌入文档

[英]cannot find embedded documents in mongodb

基于ID更新MongoDB中的多个文档

[英]Updating Multiple Documents In MongoDB Based on ID

如何在mongoDB中的数组和文档之间进行匹配和查找

[英]How to match and find between an array and documents in mongoDB

如何转义reqexp在MongoDB中查找文档？

[英]How to escape reqexp to find documents in MongoDB?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 在Mongodb中查找基于Year的文档在MongoDB中查找具有字符串ID数组的文档 MongoDB-尝试基于查询字符串查找文档时，如何将.or转换为等效的聚合？如何基于子字符串数组上的字符串匹配查找猫鼬文档 MongoDB - 查找符合条件的文档使用 mongoose 查找 mongodb 中的文档在 mongodb 中找不到嵌入文档基于ID更新MongoDB中的多个文档如何在mongoDB中的数组和文档之间进行匹配和查找如何转义reqexp在MongoDB中查找文档？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM