如何將 2D 邊界框像素坐標 (x, y, w, h) 轉換為相對坐標（Yolo 格式）？

Question

嗨！我正在通過在線平台注釋圖像數據，該平台生成這樣的輸出坐標： bbox":{"top":634,"left":523,"height":103,"width":145}但是，我想使用此注釋來訓練 Yolo。所以，我必須將其轉換為 yolo 格式，如下所示： 4 0.838021 0.605556 0.177083 0.237037

在這方面，我需要有關如何轉換它的幫助。

Answer 1

在這里，對於需要傳遞 (w,h) 的大小和需要傳遞的框 (x,x+w, y, y+h) https://github.com/ivder/LabelMeYoloConverter/blob /master/convert.py

def convert(size, box):
    dw = 1./size[0]
    dh = 1./size[1]
    x = (box[0] + box[1])/2.0
    y = (box[2] + box[3])/2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x*dw
    w = w*dw
    y = y*dh
    h = h*dh
    return (x,y,w,h)

或者，您可以在下面使用

def convert(x,y,w,h):
 dw = 1.0/w
 dh = 1.0/h
 x = (2*x+w)/2.0
 y = (2*y+w)/2.0
 x = x*dw
 y = y*dh
 w = w*dw
 h = h*dh
 return (x,y,w,h)

每個網格單元預測 B 個邊界框以及 C 類概率。 邊界框預測有 5 個分量：（x、y、w、h、置信度）。 (x, y) 坐標表示框的中心，相對於網格單元的位置（請記住，如果框的中心不在網格單元內，則該單元不對其負責）。 這些坐標被歸一化為介於 0 和 1 之間。 (w, h) 框尺寸也被歸一化為 [0, 1]，相對於圖像大小。 讓我們看一個例子：

yolo算法的坐標輸出代表什么？

Answer 2

將 bbox 字典轉換為具有相對坐標的列表

如果要將帶有鍵top 、 left 、 widht 、 height的 Python 字典轉換為格式為 [ x1 , y1 , x2 , y2 ] 的列表

其中x1 ， y1是相對坐標top left corner邊框和x2 ， y2是相對坐標bottom right corner你可以用下面的函數邊框：

def bbox_dict_to_list(bbox_dict, image_size):
  h = bbox_dict.get('height')
  l = bbox_dict.get('left')
  t = bbox_dict.get('top')
  w = bbox_dict.get('width')

  img_w, img_h = image_size

  x1 = l/img_w
  y1 = t/img_h
  x2 = (l+w)/img_w
  y2 = (t+h)/img_h
  return [x1, y1, x2, y2]

您必須將 bbox 字典作為參數傳遞，並將圖像大小作為元組傳遞 -> (image_width, image_height)

例子

bbox = {"top":634,"left":523,"height":103,"width":145} 
bbox_dict_to_list(bbox, (1280, 720))
>> [0.40859375, 0.8805555555, 0.521875, 1.02361111111]

您可以更改退貨單以滿足您的需求

如何將 2D 邊界框像素坐標 (x, y, w, h) 轉換為相對坐標（Yolo 格式）？

問題描述

2 個解決方案

解決方案1
3 2020-11-01 16:45:34

解決方案2
0 2020-12-08 22:02:11

將 bbox 字典轉換為具有相對坐標的列表

如何將 2D 邊界框像素坐標 (x, y, w, h) 轉換為相對坐標（Yolo 格式）？

問題描述

2 個解決方案

解決方案1 3 2020-11-01 16:45:34

解決方案2 0 2020-12-08 22:02:11

將 bbox 字典轉換為具有相對坐標的列表

解決方案1
3 2020-11-01 16:45:34

解決方案2
0 2020-12-08 22:02:11