繁体 English 中英

使用自定义语料库训练NLTK中的NER模型

[英]Train NER model in NLTK with custom corpus

原文 2017-03-09 21:55:56 6 1 python/ nlp/ nltk/ named-entity-recognition

我在conll2002格式中有一个带注释的语料库，即一个制表符分隔文件，带有一个标记，pos-tag和IOB标记，后跟实体标记。 例：

John NNP B-PERSON

我想在NLTK中训练一个葡萄牙语 NER模型，最好是MaxEnt模型。 我不想使用NLTK的“内置”斯坦福大学NER，因为我已经能够使用独立的斯坦福NER。 我想使用MaxEnt模型作为斯坦福NER的比较。

我找到了NLTK培训师，但我无法使用它。

我怎样才能做到这一点？

1 个解决方案

nltk书的第6章和第7章解释了如何在IOB编码的语料库上训练“chunker”。 第7章中的例子进行了NP分块，但这是偶然的 - 你的chunker将无论你训练什么都会大块。 您需要确定哪些功能对命名实体识别有用; 第6章介绍了为分类器选择功能的基础知识。 最后，查看nltk自己的命名实体chunker使用的功能的来源。 他们可能也会用葡萄牙语做得很好; 然后你可以尝试添加词干或其他葡萄牙语特有的功能。

使用NLTK for Python训练定制的语料库

[英]Train customized corpus, with NLTK for Python

spaCy v3 基于现有 model 训练 NER 或将自定义训练的 NER 添加到现有 model

[英]spaCy v3 train NER based on existing model or add custom trained NER to existing model

NLTK-在自定义语料库中解码Unicode

[英]NLTK - Decoding Unicode in custom corpus

如何在自己的语料库上测试默认的NLTK NER分块器的准确性？

[英]How to test the default NLTK NER chunker's accuracy on own corpus?

训练MITIE ner模型的数据集

[英]Dataset to train MITIE ner model

训练自定义NER模型

[英]Training custom NER model

如何在整个 Penn Treebank 语料库上训练 NLTK？

[英]How can I train NLTK on the entire Penn Treebank corpus?

使用NLTK for Python训练推文进行情感分析

[英]Train corpus of Tweets for Sentiment Analysis, using NLTK for Python

使用CSV文件在NLTK中创建自定义语料库

[英]Creating custom corpus in NLTK using CSV file

NLTK自定义分类语料库不读取文件

[英]NLTK custom categorized corpus not reading files

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 使用NLTK for Python训练定制的语料库 spaCy v3 基于现有 model 训练 NER 或将自定义训练的 NER 添加到现有 model NLTK-在自定义语料库中解码Unicode 如何在自己的语料库上测试默认的NLTK NER分块器的准确性？训练MITIE ner模型的数据集训练自定义NER模型如何在整个 Penn Treebank 语料库上训练 NLTK？使用NLTK for Python训练推文进行情感分析使用CSV文件在NLTK中创建自定义语料库 NLTK自定义分类语料库不读取文件

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM