繁体 English 中英

使用 spacy python 的自定义 NER 需要多少训练数据（句子）？[只是粗略的想法]

[英]How many training data(sentences) are required for custom NER using spacy python?[Just rought idea]

原文 2019-12-26 12:25:00 7 2 python/ machine-learning/ spacy/ ner

我想知道假设我有 10 个自定义实体来识别我应该给出多少带注释的训练句子（任何粗略的想法）？

先感谢您！！ :)

我是新手，请帮忙

2 个解决方案

为了开发自定义的 ner 模型，每个实体至少需要 50-100 次出现以及它们的适当上下文。 否则，如果您的数据少于自定义模型，则会过度拟合。 因此，根据您的数据，您将需要至少 200 到 300 个句子。

对于来自 Spacy 的自定义 NER 模型，每个实体肯定需要大约 100 个样本，并且在你的数据集中也没有任何偏差。

这一切都是根据我的经验。

建议-：Spacy Custom 模型你可以探索，但是对于生产级别或一些好的项目，你不能完全依赖它，你必须同时做一些NLP/关系提取等。

希望这可以帮助。

如何使用 SpaCy 更改自定义 NER model 再训练的训练数据格式？

[英]How to change the format of training data for custom NER model retraining using SpaCy?

使用 Spacy 进行 NER 训练

[英]NER training using Spacy

使用自定义数据训练 Spacy 的预定义 NER 模型，需要了解复合因子、批量大小和损失值

[英]Training predefined NER model of Spacy, with custom data, need idea about compound factor, batch size and loss values

如何使用 spacy3 在训练自定义 NER model 中提供 100 个注释文件的多个

[英]How can I feed multiple of 100 annotated files in training Custom NER model using spacy3

这个 for 循环如何在 Spacy 的自定义 NER 训练代码中工作？

[英]How does this for loop work in Spacy's custom NER training code?

在自定义数据集上训练 Spacy NER 出错

[英]Training Spacy NER on custom dataset gives error

SpaCy 自定义 NER 模型训练中“drop”的含义？

[英]Meaning of "drop" in SpaCy custom NER model training?

Spacy NER模型训练数据改进

[英]Spacy NER Model Training Data Improvement

在 Google Colab 上使用 spacy 训练 NER

[英]Training NER using spacy on Google Colab

将 Spacy 训练数据格式转换为 Spacy CLI 格式（用于空白 NER）

[英]Converting Spacy Training Data format to Spacy CLI Format (for blank NER)

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何使用 SpaCy 更改自定义 NER model 再训练的训练数据格式？使用 Spacy 进行 NER 训练使用自定义数据训练 Spacy 的预定义 NER 模型，需要了解复合因子、批量大小和损失值如何使用 spacy3 在训练自定义 NER model 中提供 100 个注释文件的多个这个 for 循环如何在 Spacy 的自定义 NER 训练代码中工作？在自定义数据集上训练 Spacy NER 出错 SpaCy 自定义 NER 模型训练中“drop”的含义？ Spacy NER模型训练数据改进在 Google Colab 上使用 spacy 训练 NER 将 Spacy 训练数据格式转换为 Spacy CLI 格式（用于空白 NER）

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM