繁体   English   中英

使用 Spacy 预测的 NER 实体的置信度得分

[英]Confidence Score of Predicted NER entities using Spacy

我正在尝试使用 spacy 使用自定义训练的 NER 模型来预测实体。 我读到https://github.com/explosion/spaCy/pull/8855可以使用 spancat 获得每个实体的置信度分数。 但是我对完成这项工作有点困惑。 根据我的理解,我们必须使用 spancat 组件来训练管道。 所以在训练时,在配置文件中有一个段,

[nlp]
lang = "en"
pipeline = ["tok2vec","ner"]
batch_size = 1000

我们是否应该将其更改为

[nlp]
lang = "en"
pipeline = ["tok2vec","ner","spancat"]
batch_size = 1000

为spancat工作。

然后在训练之后,同时从未知文本中预测实体,我们是否应该使用

doc = nlp(data_to_be_predicted)
spans = doc.spans["spancat"] # SpanGroup
print(spans.attrs["scores"]) # list of numbers, span length as SpanGroup

以获得置信度分数。

我正在使用 spacy 3.1.3。 我相信根据文档,此功能现已推出。

我不确定您的帖子中是否有问题,但是是的,spancat 可用,您可以从中获取实体分数。

spancat 是与 ner 组件不同的组件。 所以如果你这样做:

pipeline = ["tok2vec","ner","spancat"]

spancat 不会为您的 ner 组件预测的内容添加分数。 您可能想要删除 ner 组件。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM