繁体 English 中英

使用BRAT为OpenNlp创建和培训模型？

[英]Creating and training a model for OpenNlp using BRAT?

原文 2016-10-05 14:58:04 8 1 java/ opennlp/ brat

我可能需要为OpenNLP创建自定义训练集，这需要我手动注释很多条目。

为了简化操作，GUI解决方案可能是最好的想法（手动编写注释标签并不酷），我刚刚发现BRAT看起来像我需要的东西。

BRAT可以导出带注释的文件（.ann），但我在OpenNLP手册中找不到对此文件类型的任何引用，我不确定这是否可行。

我想做的是从BRAT导出这个带注释的文件并用它来训练OpenNLP的模型，我真的不在乎是否可以使用代码或CLI来完成。

有人能指出我正确的方向吗？

1 个解决方案

OpenNLP本身支持BRAT格式，用于培训和评估名称查找器。 目前不支持其他组件。 添加对其他组件的支持可能并不困难，如果您感兴趣，您应该在opennlp-dev列表中询问它。

CLI可用于训练带有brat的模型，这里的命令将显示用法：

bin / opennlp TokenNameFinderTrainer.brat

以下参数是训练模型的必要条件：

bratDataDir这应该指向包含.ann和.txt文件的文件夹
annotationConfig这必须指向brat用于注释项目的配置文件
lang你的文本文件的语言（例如en）
为已创建的模型文件的名称建模

名称查找器需要将其输入切割成句子和标记。 默认情况下，它假定每行一个句子并应用空格标记化。 可以使用ruleBasedTokenizer或tokenizerModel参数调整此行为。 另外，可以通过sentenceDetector Model参数使用自定义句子检测器模型。

要评估您的模型，可以通过将.brat附加到其名称来以简单的方式使用交叉验证和评估工具。

bin / opennlp TokenNameFinderCrossValidator.brat
bin / opennlp TokenNameFinderEvaluator.brat

要加快注释项目，可以使用opennlp-brat-annotator。 它可以加载Name Finder模型并与BRAT集成以自动注释您的文档。 这可以加快您的注释工作。 您可以在opennlp沙箱中找到该组件。

自定义模型培训opennlp

[英]Custom Model training opennlp

训练分类模型Opennlp

[英]Training a categorizer model Opennlp

使用openNLP maxent训练模型

[英]Training models using openNLP maxent

如何在OpenNLP中创建一个良好的NER培训模型？

[英]How to create a good NER training model in OpenNLP?

使用OpenNlp逐步训练自己的不同语言的分块器模型，并获得预测序列的概率分数

[英]Step by Step Training own chunker model of different language using OpenNlp and getting probability score for predicted sequence

创建我们自己的模型来训练openNLP并在Java中使用它

[英]Create our own model for training openNLP and use it in java

如何配置OpenNLP Brat批注服务？

[英]How do I configure the OpenNLP Brat Annotation Service?

如何使用OpenNLP创建自定义模型？

[英]How to create Custom model using OpenNLP?

培训OpenNLP文档分类

[英]Training OpenNLP document classification

使用泰语模型时，OpenNLP会出错

[英]OpenNLP gives error when using Thai model

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 自定义模型培训opennlp 训练分类模型Opennlp 使用openNLP maxent训练模型如何在OpenNLP中创建一个良好的NER培训模型？使用OpenNlp逐步训练自己的不同语言的分块器模型，并获得预测序列的概率分数创建我们自己的模型来训练openNLP并在Java中使用它如何配置OpenNLP Brat批注服务？如何使用OpenNLP创建自定义模型？培训OpenNLP文档分类使用泰语模型时，OpenNLP会出错

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM