Python：使用 Spacy 等對名詞短語（例如介詞）進行分塊

Question

自從有人告訴我 Spacy 是用於自然語音處理的如此強大的 Python 模塊，我現在正在拼命尋找一種方法來將單詞組合在一起，而不僅僅是名詞短語，最重要的是，介詞短語。 我懷疑是否有一個 Spacy 函數，但我猜這將是最簡單的方法（SpacySpaCy 導入已在我的項目中實現）。 盡管如此，我對短語識別/分塊的任何可能性持開放態度。

Answer 1

這是獲得PP的解決方案。 通常，您可以使用subtree獲取短語。

def get_pps(doc):
    "Function to get PPs from a parsed document."
    pps = []
    for token in doc:
        # Try this with other parts of speech for different subtrees.
        if token.pos_ == 'ADP':
            pp = ' '.join([tok.orth_ for tok in token.subtree])
            pps.append(pp)
    return pps

用法：

import spacy

nlp = spacy.load('en_core_web_sm')
ex = 'A short man in blue jeans is working in the kitchen.'
doc = nlp(ex)

print(get_pps(doc))

這打印：

['in blue jeans', 'in the kitchen']

Python：使用 Spacy 等對名詞短語（例如介詞）進行分塊

問題描述

1 個解決方案

解決方案1
8 2017-10-29 11:25:34

Python：使用 Spacy 等對名詞短語（例如介詞）進行分塊

問題描述

1 個解決方案

解決方案1 8 2017-10-29 11:25:34

解決方案1
8 2017-10-29 11:25:34