[英]Confidence Score of Predicted NER entities using Spacy
我正在尝试使用 spacy 使用自定义训练的 NER 模型来预测实体。 我读到https://github.com/explosion/spaCy/pull/8855可以使用 spancat 获得每个实体的置信度分数。 但是我对完成这项工作有点困惑。 根据我的理解,我们必须使用 spancat 组件来训练管道。 所以在训练时,在配置文件中有一个段,
[nlp]
lang = "en"
pipeline = ["tok2vec","ner"]
batch_size = 1000
我们是否应该将其更改为
[nlp]
lang = "en"
pipeline = ["tok2vec","ner","spancat"]
batch_size = 1000
为spancat工作。
然后在训练之后,同时从未知文本中预测实体,我们是否应该使用
doc = nlp(data_to_be_predicted)
spans = doc.spans["spancat"] # SpanGroup
print(spans.attrs["scores"]) # list of numbers, span length as SpanGroup
以获得置信度分数。
我正在使用 spacy 3.1.3。 我相信根据文档,此功能现已推出。
我不确定您的帖子中是否有问题,但是是的,spancat 可用,您可以从中获取实体分数。
spancat 是与 ner 组件不同的组件。 所以如果你这样做:
pipeline = ["tok2vec","ner","spancat"]
spancat 不会为您的 ner 组件预测的内容添加分数。 您可能想要删除 ner 组件。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.