簡體 English 中英

使用預訓練模型（Keras、Tensorflow）的 Mask R-CNN、Faster R-CNN 的最佳圖像大小

[英]Optimal image sizes for Mask R-CNN, Faster R-CNN, using pretrained models (Keras, Tensorflow)

原文 2017-12-25 00:50:04 5 2 tensorflow/ keras/ resnet

許多現有的 Tensorflow 和 Keras CNN 代碼示例使用相同的尺寸來訓練圖像，通常是 299*299、244*244、256*256 等等。 我認為這部分取決於與預訓練模型的兼容性以及架構本身。

我仍在評估架構，但最終可能會使用 Mask R-CNN（或 Faster R-CNN），使用 Resnet、Inception 或 Xception，以及 Tensorflow 或 Keras。 要分析的目標圖像在 1024*1024 范圍內，但可以分成更小的分區。

鑒於可用的預訓練模型，是否有可以提供任何優勢的訓練圖像大小？ 我想避免事后調整大小，因為在某些情況下這會降低圖像清晰度。

2 個解決方案

好的，我找到了部分答案：

Girshick 的 Faster R-CNN 顯然對輸入圖像進行了內部縮放，使得它們的較短尺寸為 600 像素，但較大的邊緣被限制在 1000 像素。 聽起來這是由於可用 GPU 的內存限制。

鑒於圖像縮放會造成 CPU 影響，並且還會導致邊緣出現一些鋸齒，因此在圖像預處理方面似乎有優勢。

我還沒有找到 Mask R-CNN 的等效信息。

根據可以在此處找到的 Matterport 實現https://github.com/matterport/Mask_RCNN ，圖像的輸入大小為 1024x1024。 此外，在論文中他們提到他們使用 1024 像素作為運行城市景觀的輸入（檢查附錄 b，我相信）。

基於預訓練模型的Mask R-CNN訓練時間分配

[英]Time allocation for training a Mask R-CNN based on a pretrained model

為什么Tensorflow對象檢測禁用更快的R-CNN正則化

[英]Why Tensorflow Object Detection disable regularization for Faster R-CNN

使用resnet更快的r-cnn進行Tensorflow對象API的最大迭代

[英]Max iteration of Tensorflow object API with resnet faster r-cnn

R-CNN 中的說明

[英]Clarification in R-CNN

4 步交替 RPN/更快的 R-CNN 訓練？ - Tensorflow 對象檢測模型

[英]4-step Alternating RPN / Faster R-CNN Training? - Tensorflow Object Detection Models

在 Mask R-CNN 中添加多個類

[英]Adding multiple classes in Mask R-CNN

FASTER R-CNN 的混淆矩陣

[英]Confusion matrix for FASTER R-CNN

訓練更快的R-CNN時出錯

[英]Error with training Faster R-CNN

使用R-CNN進行物體檢測？

[英]Object detection with R-CNN?

如何在iOS應用程序上實現Mask R-CNN？

[英]How to implement Mask R-CNN on iOS application?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 基於預訓練模型的Mask R-CNN訓練時間分配為什么Tensorflow對象檢測禁用更快的R-CNN正則化使用resnet更快的r-cnn進行Tensorflow對象API的最大迭代 R-CNN 中的說明 4 步交替 RPN/更快的 R-CNN 訓練？ - Tensorflow 對象檢測模型在 Mask R-CNN 中添加多個類 FASTER R-CNN 的混淆矩陣訓練更快的R-CNN時出錯使用R-CNN進行物體檢測？如何在iOS應用程序上實現Mask R-CNN？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM