[英]Tensorflow Object Detection API Faster-RCNN converges but detection is innacurate
我正在嘗試使用Tensorflow對象檢測API來識別Guinness徽標。 該過程類似於此處顯示的過程-https: //towardsdatascience.com/building-a-toy-detector-with-tensorflow-object-detection-api-63c0fdf2ac95 。
我已經准備了100幅訓練圖像,使用增強可以達到大約5000幅訓練圖像。 (使用Imgaug)。 在張量板上進行訓練時,我看到了一條看起來不錯的學習曲線,損失了<0.1,但是當我導出並測試該圖時,我得到了很多誤報和非常不准確的結果。 我正在嘗試找出原因。
Tensorboard性能圖
請注意,為了自動標記圖像,我在徽標周圍整齊地裁剪了原始的100張,然后以編程方式將其放置在隨機背景圖像上,並帶有邊框。 范例-
所有的訓練圖像均為800x600,但是實際的邊界框和徽標會小得多,如您所見。
這是同一張圖片的xml注釋文件-
<?xml version="1.0" encoding="utf-8"?> <annotation> <folder>images</folder> <filename>57.png</filename> <path>model\\images\\57.png</path> <source> <database>Unknown</database> </source> <size> <width>800</width> <height>600</height> <depth>3</depth> </size> <segmented>0</segmented> <object> <name>guinness</name> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <xmin>225</xmin> <ymin>329</ymin> <xmax>516</xmax> <ymax>466</ymax> </bndbox> </object> </annotation>
有人知道為什么tensorflow可以正確地對測試圖像進行分類,但是當我在真實世界的圖像上進行測試時,檢測結果也不准確嗎? 歡迎任何建議,並隨時要求更多信息。
幾個想法
您的測試圖像是否也尺寸為800 * 600?
您可能要使用配置文件中的image_resizer值
最終,我放棄了將徽標圖像放置在隨機背景上的方法,而是手動標記了它們,然后使用圖像增強來增加訓練集的大小。 這似乎大大改善了我的結果。 我認為這與上下文准確的背景有關,實際上在培訓中非常重要。
希望這對某些人有幫助,謝謝您的幫助。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.