簡體   English   中英

Spacy NER將實體分為兩個單獨的實體

[英]Spacy NER splitting the entity into two separate entities

我在以下文字上做NER

print([(i.text, i.label_) for i in doc.ents])

我的文字看起來像

ZS L-1 Cocoa & Burgers Ltd
-
2013 to 2017

我正在輸出

('ZS L-1', 'ORG'), ('Cocoa & Burgers Ltd', 'ORG'), ('2017', 'DATE')

我如何正確獲得ORG名稱

('ZS L-1 Cocoa & Burgers Ltd', 'ORG')

此外,它也無法將2013識別為DATE實體。 我的spacy版本是2.0,並且我正在使用此模型-en_core_web_md-2.0.0。 當我對全文進行NER時,通常會發生這種情況。 當我僅使用公司名稱進行NER時,效果很好。

我沒有足夠的聲譽來發表評論,因此請在此處添加答案:

您有兩種解決方案:

您可以根據自己的數據訓練模型:

訓練spaCy的統計模型

第二種選擇嘗試下載大型模型,這次您正在使用中型:

可用型號:sm,md,lg

您還可以在這里比較大型模型的輸出:

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM