繁体   English   中英

使用CRF模型(CRFSuite)标记商品时处理缺失或未知的功能

[英]Dealing with missing or unknown features when tagging items using CRF model (CRFSuite)

我正在使用CRFSuite(python-crfsuite实现)来构建命名实体提取器,类似于http://nbviewer.ipython.org/github/tpeng/python-crfsuite/blob/master/examples/上的教程CoNLL%202002.ipynb训练输入是一个单词序列,每个单词都有许多功能。

问题在于,对于我的特定用例,我并不总是具有我要识别的实体的功能。 我希望CRF模型能够根据周围单词的特征来识别实体。 但是,当我只输入一个空的dict {}作为单词的特征时,命名实体就永远不会被适当地分类。

我想知道是否有一种功能或标准方法来处理这种情况,在训练模型后,人们并不总是具有所有项目的功能。

在某些情况下,为缺失的功能(例如“-”或“ +”)分配固定值可能会很有用。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM