繁体   English   中英

doccano 中的自动标记

[英]Auto labelling in doccano

我正在为 NLP 进行手动注释,找到了一个很酷的工具,名为 DOCCANO 用于注释,它具有自动标记功能。 如果有人知道如何使用自定义 REST api 请求设置自动注释。

序列标签项目示例:

假设我们有自定义 API 需要在请求正文中分类发送文本,如下所示:

{
    "text": "example text"
}

在 Doccano 中设置 Auto Labeling 时,在第二个屏幕Set parameters中,设置您的 API url 和其他可选参数(例如身份验证标头),然后使用屏幕截图所示的text变量,使用{{ text }}格式。 每次调用自动标记 API 时,它都会发送文本来代替这个变量。

使用文本变量

在下一步设置模板中,我们需要指定一个映射模板,用于将 API 响应映射到特定格式的 doccano。 在这种情况下,我们可以使用这个:

映射模板

它使用jinja格式,这里是截图中的映射模板:

[
    {% for entity in input %}
        {
            "start_offset": {{ entity.start_offset }},
            "end_offset": {{ entity.end_offset}},
            "label": "P-B"
        }{% if not loop.last %},{% endif %}
    {% endfor %}
]

最后,在最后一步中,我们将上一步中的 map 标签添加到之前在 doccano 项目中创建的标签。 这应该很简单。

映射

然后只需单击完成,我们对 go 很好。

要启用自动标记,请在“数据集”选项卡中打开任何数据点,然后在单击“自动标记”按钮后显示的window中切换开关。 从现在开始,每次你打开一个未经批准的数据行时,它都会自动为你使用自动标记到 label 的文本。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM