使用 Spacy 预测的 NER 实体的置信度得分

Question

我正在尝试使用 spacy 使用自定义训练的 NER 模型来预测实体。 我读到https://github.com/explosion/spaCy/pull/8855可以使用 spancat 获得每个实体的置信度分数。 但是我对完成这项工作有点困惑。 根据我的理解，我们必须使用 spancat 组件来训练管道。 所以在训练时，在配置文件中有一个段，

[nlp]
lang = "en"
pipeline = ["tok2vec","ner"]
batch_size = 1000

我们是否应该将其更改为

[nlp]
lang = "en"
pipeline = ["tok2vec","ner","spancat"]
batch_size = 1000

为spancat工作。

然后在训练之后，同时从未知文本中预测实体，我们是否应该使用

doc = nlp(data_to_be_predicted)
spans = doc.spans["spancat"] # SpanGroup
print(spans.attrs["scores"]) # list of numbers, span length as SpanGroup

以获得置信度分数。

我正在使用 spacy 3.1.3。 我相信根据文档，此功能现已推出。

Answer 1

我不确定您的帖子中是否有问题，但是是的，spancat 可用，您可以从中获取实体分数。

spancat 是与 ner 组件不同的组件。 所以如果你这样做：

pipeline = ["tok2vec","ner","spancat"]

spancat 不会为您的 ner 组件预测的内容添加分数。 您可能想要删除 ner 组件。

使用 Spacy 预测的 NER 实体的置信度得分

问题描述

1 个解决方案

解决方案1
1 2021-10-24 03:48:15

使用 Spacy 预测的 NER 实体的置信度得分

问题描述

1 个解决方案

解决方案1 1 2021-10-24 03:48:15

解决方案1
1 2021-10-24 03:48:15