标签[match-phrase] - 堆栈内存溢出

计算一个短语在另一个短语附近的次数，彼此相隔 n# 个单词 - Count number of times a phrase is near another phrase, within n# of words of each other

我需要计算在 dataframe 字符串的每一行中，特定短语在另一个特定短语的 3 个单词内出现的次数。顺序无关紧要。为了说明：X =“黑猫”，Y =“是我的”，接近距离 = 3，并且字符串 =“黑猫是我的黑猫”，...... output 计数将是两个（找到两个独特的对). “ window ...

从 pandas 列中用 spaCy 提取段落周围的短语 - Extract paragraph surrounding phrase with spaCy from pandas column

我有一个数据框，其中一列包含文本数据。在本专栏中，我想使用 spaCy 检索匹配词周围的句子。考虑这个玩具数据框：这个短语匹配器包含两个模式matchw1和matchw2 ：import spacy nlp = spacy.load("en_core_web_sm") phrase_matc ...

ElasticSearch 文本字段上的无痛过滤器脚本不起作用 - ElasticSearch painless filter script on text fields not working

我想在 ElasticSearch 中使用无痛脚本使用相等过滤器（完全匹配）。我不能直接使用term查询，因为我想做的检查是在text字段（而不是keyword ）上，所以我尝试了match_phrase 。这是我的映射：我无法更改它。{ "my_index": { "aliase ...

ElasticSearch 文本字段与脚本完全匹配 - ElasticSearch exact match on text field with script

我正在尝试使用在text字段中具有特定值的 ElasticSearch 查询文档进行搜索。我知道如果它是keyword字段，则使用术语查询是可能的。不幸的是，我无法更改映射。{ "my_index": { "aliases": {}, "mappings": { ...

Elatisearch match_phrase_prefix 查询，前缀完全匹配 - Elatisearch match_phrase_prefix query, with exact prefix match

我有一个 match_phrase_prefix 查询，它按预期工作。但是当用户在关键字末尾传递任何特殊字符时，ES 忽略这些字符，仍然返回结果。 query{ match_phrase_prefix:{ content: { query: searchTerm } } } 我正在使用此查询来搜索 ...

弹性 match_phrase_prefix 设置单词顺序 - elastic match_phrase_prefix set order of words

无法找到一种干净的方法来执行这种类型的查询——有没有办法指定这些前缀只返回带有单词前缀的结果？这样一个有效的回报将是 Alpha Beta 而 Beta Alpha 不会返回？ }, ...

Python 中的 Spacy 正则表达式短语匹配器 - Spacy Regex Phrase Matcher in Python

在大量文本语料库中，我有兴趣提取句子中某处具有（动词-名词）或（形容词-名词）特定列表的每个句子。我有一个很长的清单，但这里有一个示例。在我的 MWE 中，我试图用“write/wrote/writing/writes”和“book/s”提取句子。我有大约 30 对这样的词。这是我尝试过的， ...

Elasticsearch 通配符、正则表达式、match_phrase、前缀查询返回错误结果 - Elasticsearch wildcard, regexp, match_phrase, prefix query returning wrong results

我刚刚开始使用 Elasticsearch，版本 7.5.1。我想查询以特定单词片段开头的结果。例如tho * 应该返回包含以下内容的数据：思想，汤姆森，那些，等等。我试过 - 正则表达式通配符字首匹配短语所有这些都返回正确的结果，但它们也都返回单词method 。同样cat * ...

Match_phrase 是弹性搜索未按预期工作 - Match_phrase is elastic search not working as expected

在我的弹性搜索中，我的文档包含一个“字段名”，其值为“abc”和“abc-def”。当我使用 match_phrase 查询搜索字段名为“abc”的文档时，它也会返回值为“abc-def”的文档。但是，当我查询“abc-def”时，它工作正常。我的查询如下：有人可以帮我理解这个问题吗？ ...

ElasticSearch：不匹配 - ElasticSearch: Not giving match

我想执行完全单词匹配和部分单词/子字符串匹配。例如，如果我搜索“测试产品”，那么我应该能够在结果中找到“测试”和“产品”相关的文本。我正在使用以下匹配查询搜索弹性搜索，这并没有给我完全匹配，而是它也给出了一些更不重要的匹配。例如，它在结果中给出了“样本”相关的文本。我正在使用弹性搜索 6.3 ...

弹性搜索中的查询字符串 - Query string in elastic search

我正在使用以下匹配查询搜索弹性搜索，这并没有给我完全匹配，而是给出了一些更不重要的匹配。我正在使用弹性搜索 6.3 请在下面找到我的查询搜索结果： “命中”：[{“_index”：“67107104”，“_type”：“_doc”，“_id”：“1”，“_score”：0.6931471，“_ ...

如何关闭easticsearch match_phrase或match_phrase_prefix的自动完成？ - How to turn off autocomplete for easticsearch match_phrase or match_phrase_prefix?

我有 ES 数据，其中包含text类型的字段name 。我必须通过小写输入进行搜索，而实际名称可能使用大小写符号。我只需要确切的（但不区分大小写）名称。我尝试使用match_phrase （以及match_phrase_prefix ）。但它会返回自动完成的结果。喜欢查询返回两项：和 ...

Elastic Search 1.4 短语查询，在搜索字符串中使用带有连字符 (-) 的 OR 运算符 - Elastic Search 1.4 phrase query with OR operator with hyphen (-) in search string

我在 Elastic search 1.4 短语查询中遇到问题。我正在使用数据创建以下索引。 curl -XPUT localhost:9200/test curl -XPOST localhost:9200/test/doc/1 -d '{"field1": "abc-xyz"}' cur ...

Elasticsearch 重要术语聚合 doc_count 在对相同术语进行匹配短语搜索时与命中不同 - Elasticsearch significant terms aggregation doc_count differs from hits when doing a match phrase search for the same term

我正在使用重要术语聚合，它使用以下查询为我提供了 n 重要术语及其 doc_count 和 bg_count：如果我采用重要术语聚合返回的术语并对该术语进行匹配短语查询。然后，我得到的 hits 值与聚合中的 doc_count 不同。匹配词组查询：字段preprocess_data.res ...

Elasticsearch JSON 上的精确短语匹配 - Elasticsearch exact phrase match on JSON

我正在使用 elasticsearch 从 json 字段进行精确的短语匹配。我已经尝试过multi_match 、 query_string和simple_query_string等多种语法，但它们并没有完全按照给定的短语返回结果。我正在使用的query_string语法；我也尝试了过滤器而 ...

ElasticSearch - 整个文档的短语匹配？不仅仅是一个特定的领域 - ElasticSearch - Phrase match on whole document? Not just one specific field

有没有办法可以在整个文档上使用弹性 match_phrase？不仅仅是一个特定的领域。我们希望用户能够输入带引号的搜索词，并在文档中的任何位置进行短语匹配。目前，我只找到了特定领域的短语匹配。我必须指定字段以在其中进行短语匹配。我们的文档有数百个字段，所以我认为在每个 match_ ...

Elasticsearch 6.8 match_phrase 搜索 N-gram 分词器效果不佳 - Elasticsearch 6.8 match_phrase search N-gram tokenizer works not well

我使用 Elasticsearch N-gram tokenizer并使用match_phrase模糊匹配我的索引和测试数据，如下所示：检查_分析： _分析结果：当我搜索“rm”时，什么也没找到：但是可以找到“.rf”：我的问题：为什么即使 _analyze 已经拆分 ...

elasticsearch match_phrase 查询用于精确的子字符串搜索 - elasticsearch match_phrase query for exact sub-string search

我使用 match_phrase 查询进行搜索全文匹配。但它并没有像我想象的那样工作。询问：结果：期待：映射：结果不是我所期望的。我希望得到的结果与搜索/critical-illness作为存储文本的 substring 完全相同。 ...

对于 ElasticSearch match_phrase 查询，如何考虑词序但不要求所有搜索词都存在于文档中？ - How to takes word order into account but does not require all searched words to exist in document for ElasticSearch match_phrase query?

假设我的索引有两个文档： “拿我的钱” “我的钱到了” 当我对“get my money”进行常规匹配查询时，两个文档都正确匹配，但得分相同。但是，我希望在评分过程中单词的顺序很重要。换句话说，我希望“得到我的钱”有更高的分数。因此，我尝试将匹配查询放在 bool 查询的 must 子句 ...

如何在弹性搜索中使用必须或条件中的多个匹配短语？ - how to use multiple match phrases in must with or condition in elastic search?

如何在弹性搜索中使用必须或条件中的多个匹配短语？尝试了这个查询....我需要在标签中单词完全匹配或在正文或标题或 answer.body 上部分匹配的结果但它不起作用。添加评论获取 questiondetails_new/question/_search? {“查询”：{“布尔”：{“应该” ...