[英]Creating and training a model for OpenNlp using BRAT?
OpenNLP本身支持BRAT格式,用于培训和评估名称查找器。 目前不支持其他组件。 添加对其他组件的支持可能并不困难,如果您感兴趣,您应该在opennlp-dev列表中询问它。
CLI可用于训练带有brat的模型,这里的命令将显示用法:
以下参数是训练模型的必要条件:
名称查找器需要将其输入切割成句子和标记。 默认情况下,它假定每行一个句子并应用空格标记化。 可以使用ruleBasedTokenizer或tokenizerModel参数调整此行为。 另外,可以通过sentenceDetector Model参数使用自定义句子检测器模型。
要评估您的模型,可以通过将.brat附加到其名称来以简单的方式使用交叉验证和评估工具。
要加快注释项目,可以使用opennlp-brat-annotator。 它可以加载Name Finder模型并与BRAT集成以自动注释您的文档。 这可以加快您的注释工作。 您可以在opennlp沙箱中找到该组件。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.