簡體   English   中英

如何使用名為pycorenlp的python庫提取NP(名詞短語)和VP(動詞短語)

[英]How to extract NP (Noun phrases) and VP (Verb Phrases) by using library of python called pycorenlp

我正在使用pycornlp庫。 該庫為stanford corenlp提供了一個python包裝器。

我能夠得到一個下面給出的parsetree。

(ROOT
(S
 (NP (PRP He))
 (VP (VBP drink)
  (NP
    (NP (NN tomato) (NN soup))
    (PP (IN in)
      (NP (DT the) (NN morning)))))))

現在我想提取第一個NP和VP。

(NP (PRP He))
(VP (VBP drink)

pycorenlp中有可用的API嗎?

是否有其他可用的API可用於提取所有NP或所有VP?

CoreNLP的輸出通常是JSON(列表和詞典的組合),您可以輕松篩選出所需內容。

下面的鏈接有一個很好的例子,它向您展示如何連接到服務器,然后顯示一小段代碼,說明如何在輸出文件中移動並獲取所需內容。 鏈接是: http//stanza.readthedocs.io/en/latest/example.text_classification.html#annotating-using-corenlp

篩選輸出文件的示例代碼是:

for token in annotation['sentences'][0]['tokens']: print token['word'], token['pos']

'annotation'是輸出變量。 此代碼將打印單詞列表及其詞性。 一旦找到NP和VP的第一個實例,您就可以輕松修改此代碼。

對您的問題的簡單回答是,您可以通過for循環對輸出數據進行排序,以找到NP和VP的第一個實例。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM