簡體   English   中英

如何在crf ++中表示地名詞典或詞典作為特征?

[英]how to represent gazetteers or dictionaries as features in crf++?

如何使用地名詞典或詞典作為CRF ++中的功能

詳細說明:假設我想在人名上做NER,並且我有一個包含常見人名的地名詞典(或詞典),我想用這個地名詞典作為crf ++的輸入,我該怎么做?

我正在使用條件隨機字段包crf ++來執行命名實體識別任務。 我知道如何在crf ++中表示一些常用的功能。 例如,如果我們想使用Capitalization作為特征,我們可以在crf的特征模板中添加一個單獨的列,指示單詞是否大寫。

您可以創建一個新功能,指示令牌是否在詞典/ gazeteer中。 只需檢查設置成員資格並將Gazeteer功能設置為1或0。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM