我需要计算在 dataframe 字符串的每一行中,特定短语在另一个特定短语的 3 个单词内出现的次数。 顺序无关紧要。 为了说明:X =“黑猫”,Y =“是我的”,接近距离 = 3,并且字符串 =“黑猫是我的黑猫”,...... output 计数将是两个(找到两个独特的对). “ window ...
我需要计算在 dataframe 字符串的每一行中,特定短语在另一个特定短语的 3 个单词内出现的次数。 顺序无关紧要。 为了说明:X =“黑猫”,Y =“是我的”,接近距离 = 3,并且字符串 =“黑猫是我的黑猫”,...... output 计数将是两个(找到两个独特的对). “ window ...
我有一个数据框,其中一列包含文本数据。 在本专栏中,我想使用 spaCy 检索匹配词周围的句子。 考虑这个玩具数据框: 这个短语匹配器包含两个模式matchw1和matchw2 :import spacy nlp = spacy.load("en_core_web_sm") phrase_matc ...
我想在 ElasticSearch 中使用无痛脚本使用相等过滤器(完全匹配) 。 我不能直接使用term查询,因为我想做的检查是在text字段(而不是keyword )上,所以我尝试了match_phrase 。 这是我的映射:我无法更改它。{ "my_index": { "aliase ...
我正在尝试使用在text字段中具有特定值的 ElasticSearch 查询文档进行搜索。 我知道如果它是keyword字段,则使用术语查询是可能的。 不幸的是,我无法更改映射。{ "my_index": { "aliases": {}, "mappings": { ...
我有一个 match_phrase_prefix 查询,它按预期工作。 但是当用户在关键字末尾传递任何特殊字符时,ES 忽略这些字符,仍然返回结果。 query{ match_phrase_prefix:{ content: { query: searchTerm } } } 我正在使用此查询来搜索 ...
无法找到一种干净的方法来执行这种类型的查询——有没有办法指定这些前缀只返回带有单词前缀的结果? 这样一个有效的回报将是 Alpha Beta 而 Beta Alpha 不会返回? }, ...
在大量文本语料库中,我有兴趣提取句子中某处具有(动词-名词)或(形容词-名词)特定列表的每个句子。 我有一个很长的清单,但这里有一个示例。 在我的 MWE 中,我试图用“write/wrote/writing/writes”和“book/s”提取句子。 我有大约 30 对这样的词。 这是我尝试过的, ...
我刚刚开始使用 Elasticsearch,版本 7.5.1。 我想查询以特定单词片段开头的结果。 例如tho * 应该返回包含以下内容的数据: 思想,汤姆森,那些,等等。 我试过 - 正则表达式 通配符 字首 匹配短语 所有这些都返回正确的结果,但它们也都返回单词method 。 同样cat * ...
在我的弹性搜索中,我的文档包含一个“字段名”,其值为“abc”和“abc-def”。 当我使用 match_phrase 查询搜索字段名为“abc”的文档时,它也会返回值为“abc-def”的文档。 但是,当我查询“abc-def”时,它工作正常。 我的查询如下: 有人可以帮我理解这个问题吗? ...
我想执行完全单词匹配和部分单词/子字符串匹配。 例如,如果我搜索“测试产品”,那么我应该能够在结果中找到“测试”和“产品”相关的文本。 我正在使用以下匹配查询搜索弹性搜索,这并没有给我完全匹配,而是它也给出了一些更不重要的匹配。例如,它在结果中给出了“样本”相关的文本。 我正在使用弹性搜索 6.3 ...
我正在使用以下匹配查询搜索弹性搜索,这并没有给我完全匹配,而是给出了一些更不重要的匹配。 我正在使用弹性搜索 6.3 请在下面找到我的查询 搜索结果: “命中”:[{“_index”:“67107104”,“_type”:“_doc”,“_id”:“1”,“_score”:0.6931471,“_ ...
我有 ES 数据,其中包含text类型的字段name 。 我必须通过小写输入进行搜索,而实际名称可能使用大小写符号。 我只需要确切的(但不区分大小写)名称。 我尝试使用match_phrase (以及match_phrase_prefix )。 但它会返回自动完成的结果。 喜欢查询 返回两项: 和 ...
我在 Elastic search 1.4 短语查询中遇到问题。 我正在使用数据创建以下索引。 curl -XPUT localhost:9200/test curl -XPOST localhost:9200/test/doc/1 -d '{"field1": "abc-xyz"}' cur ...
我正在使用重要术语聚合,它使用以下查询为我提供了 n 重要术语及其 doc_count 和 bg_count: 如果我采用重要术语聚合返回的术语并对该术语进行匹配短语查询。 然后,我得到的 hits 值与聚合中的 doc_count 不同。 匹配词组查询: 字段preprocess_data.res ...
我正在使用 elasticsearch 从 json 字段进行精确的短语匹配。 我已经尝试过multi_match 、 query_string和simple_query_string等多种语法,但它们并没有完全按照给定的短语返回结果。 我正在使用的query_string语法; 我也尝试了过滤器而 ...
有没有办法可以在整个文档上使用弹性 match_phrase? 不仅仅是一个特定的领域。 我们希望用户能够输入带引号的搜索词,并在文档中的任何位置进行短语匹配。 目前,我只找到了特定领域的短语匹配。 我必须指定字段以在其中进行短语匹配。 我们的文档有数百个字段,所以我认为在每个 match_ ...
我使用 Elasticsearch N-gram tokenizer并使用match_phrase模糊匹配我的索引和测试数据,如下所示: 检查_分析: _分析结果: 当我搜索“rm”时,什么也没找到: 但是可以找到“.rf”: 我的问题:为什么即使 _analyze 已经拆分 ...
我使用 match_phrase 查询进行搜索全文匹配。 但它并没有像我想象的那样工作。 询问: 结果: 期待: 映射: 结果不是我所期望的。 我希望得到的结果与搜索/critical-illness作为存储文本的 substring 完全相同。 ...
假设我的索引有两个文档: “拿我的钱” “我的钱到了” 当我对“get my money”进行常规匹配查询时,两个文档都正确匹配,但得分相同。 但是,我希望在评分过程中单词的顺序很重要。 换句话说,我希望“得到我的钱”有更高的分数。 因此,我尝试将匹配查询放在 bool 查询的 must 子句 ...
如何在弹性搜索中使用必须或条件中的多个匹配短语? 尝试了这个查询....我需要在标签中单词完全匹配或在正文或标题或 answer.body 上部分匹配的结果但它不起作用。 添加评论获取 questiondetails_new/question/_search? {“查询”:{“布尔”:{“应该” ...