簡體   English   中英

doccano 中的自動標記

[英]Auto labelling in doccano

我正在為 NLP 進行手動注釋,找到了一個很酷的工具,名為 DOCCANO 用於注釋,它具有自動標記功能。 如果有人知道如何使用自定義 REST api 請求設置自動注釋。

序列標簽項目示例:

假設我們有自定義 API 需要在請求正文中分類發送文本,如下所示:

{
    "text": "example text"
}

在 Doccano 中設置 Auto Labeling 時,在第二個屏幕Set parameters中,設置您的 API url 和其他可選參數(例如身份驗證標頭),然后使用屏幕截圖所示的text變量,使用{{ text }}格式。 每次調用自動標記 API 時,它都會發送文本來代替這個變量。

使用文本變量

在下一步設置模板中,我們需要指定一個映射模板,用於將 API 響應映射到特定格式的 doccano。 在這種情況下,我們可以使用這個:

映射模板

它使用jinja格式,這里是截圖中的映射模板:

[
    {% for entity in input %}
        {
            "start_offset": {{ entity.start_offset }},
            "end_offset": {{ entity.end_offset}},
            "label": "P-B"
        }{% if not loop.last %},{% endif %}
    {% endfor %}
]

最后,在最后一步中,我們將上一步中的 map 標簽添加到之前在 doccano 項目中創建的標簽。 這應該很簡單。

映射

然后只需單擊完成,我們對 go 很好。

要啟用自動標記,請在“數據集”選項卡中打開任何數據點,然后在單擊“自動標記”按鈕后顯示的window中切換開關。 從現在開始,每次你打開一個未經批准的數據行時,它都會自動為你使用自動標記到 label 的文本。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM