[英]How do I get detect a pattern including an arbitrary string?
我有一个响应系统,我正在尝试获取它,以便您可以输入一个字符串,并将其与数据库中最可能的字符串进行匹配,方法是循环遍历每个变量,并使用预定义的问题测量Levinshtein距离,并使用一些其他算法。
示例:如果输入“嗨,你好吗?” 它将在其数据库中搜索相同或非常相似的内容(例如“嗨,你好吗?”)。 但我希望它能够检测是否使用了取决于情况的特定短语,例如:
“给我10个饼干。” 现在,我不想在数据库中添加所有可能的cookie。 那是不可能的。 因此,在数据库中,它将类似于:
“给我[数量]个cookie。” 但是我将如何检测模式? 请记住,我还将对其他响应使用字符串模式。
图书馆? Apache Lucene核心及其FuzzQuery 。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.