簡體   English   中英

如何在使用crfsuite時將上一個令牌的實體類用作NER的功能

[英]how can I use entity class of previous token as a feature for NER while using crfsuite

我正在python中使用python-crfsuite軟件包,這是由Naoaki Okazaki( http://www.chokkan.org/software/crfsuite/ )開發的CRFSUITE的實現。

我想將先前標記的實體類用作功能,這將有助於我識別多詞命名實體。 我的訓練數據示例:

[(Raheja,B-builder),(vista,I-builder),(is,O),(ver,O),(famous,O)]

在這里,如果我可以在training.but進行預測時使用上一類功能,那么在進行預測時,我們會將功能列表傳遞給tagger對象。 測試時出現的問題是以前的課程是未知的。

誰能告訴我在python-crfsuite中是否有可能。 我覺得將特征傳遞給標記對象的方式是不可能的。

我相信,基於本教程中的這一句話,crfsuite(和python-crfsuite)是不可能的:

不支持以屬性和標簽二元組為條件的功能。

默認情況下,CRFSuite中將先前標記的類用作功能。 CRFSuite使用兩種功能:

  1. “狀態特征” I(current_label=A and f(sequence, current_position))
  2. “轉換功能” I(current_label=A and previous_label=B)

您定義的特征實際上是(1)中的f函數; 將為標簽的所有可能值生成狀態功能。 要使用過渡功能,您無需執行任何操作,它們是默認情況下生成的。

CRFsuite中未實現的是第三種功能: I(current_label=A and previous_label=B and f(sequence, current_position)) 這就是本教程“以屬性和標簽二元組為條件的特征”的含義。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM