簡體 English 中英

Google ML Kit 自拍分割效果不佳

[英]Poor selfie segmentation with Google ML Kit

原文 2022-01-30 00:23:34 9 1 image-processing/ image-segmentation/ google-vision/ google-mlkit

我正在使用 Google ML Kit 進行自拍分割（https://developers.google.com/ml-kit/vision/selfie-segmentation ）。 但是，我得到的 output 非常差 -

初始圖像：

帶有疊加層的分段圖像：觀察女性的頭發是如何標記為粉紅色的，而她的腿附近的健身器材和周圍是如何標記為非粉紅色的。 甚至她的手也被標記為粉紅色（意味着它的背景）。

當它疊加在另一個圖像上時，為了創建背景去除效果，它看起來很糟糕

ML Kit 返回的分割掩碼對上述所有非粉紅色區域的置信度為 1.0，這意味着它絕對確定非粉紅色區域是人的一部分！！

我看到了幾張圖片，而不僅僅是這張。 事實上，圖像分割器的性能（置信度）非常差。

問題是 - 有沒有辦法改進它，也許通過提供不同/更好的 model？ 如果我使用像 PixelLib 這樣的東西，分割會更好，盡管庫的性能不是低延遲，因此不能在移動設備上運行。

任何關於此的指針/幫助將不勝感激。

1 個解決方案

期望基於 CPU 的輕量級實時自拍 model 為相當復雜且棘手的場景（姿勢、黑色背景和服裝）提供准確的分割結果可能過於樂觀。

官方示例強調了復雜環境可能會成為問題的事實。

處理場景的唯一“簡單”方法是使用深度估計。 剛剛用一個相當復雜的 model 做了一個快速測試：

結果遠非可用（至少以完全自動化的方式）。 還有其他幾個選項：

創建一個自定義的更面向運動的 model，在適當的數據集上進行訓練
使用較重的 model （現代手機相當有能力）
使用一些可靠的姿勢估計來確保特定場景與自拍兼容

如何確保正確處理 VisionImage（來自 Google 在 Firebase 中的 ML 套件）object？

[英]How to make sure the VisionImage (from Google's ML Kit in Firebase) object is processed right?

Fotoapparat中的ML Kit OCR返回廢話

[英]ML Kit OCR in Fotoapparat returns nonsense

ImageAnalyzer ML Kit 邊界框錯列

[英]ImageAnalyzer ML Kit bounding box mislined

Android ML Kit Firebase FirebaseVisionText，`block.getCornerPoints()`總是`return null`值

[英]Android ML Kit Firebase FirebaseVisionText , `block.getCornerPoints() `always `return null` values

我可以使用 ML kit 人臉檢測來判斷照片是否包含人臉嗎？

[英]Can I use ML kit Face detection to tell if the photo contains a face or not?

如何使用 ML Kit 增加人臉檢測期間的每秒幀數

[英]How to increase Frames Per Second during Face Detection using ML Kit

使用Python和OpenCV合並裁剪皮膚和原始自拍照的這兩個圖像？

[英]Use Python and OpenCV to merge these two images of cropped skin and original selfie?

分辨率低的tesseract

[英]tesseract with poor picture resolution

libjpeg圖像質量差

[英]libjpeg gives poor quality image

[英]Segmentation Edges

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何確保正確處理 VisionImage（來自 Google 在 Firebase 中的 ML 套件）object？ Fotoapparat中的ML Kit OCR返回廢話 ImageAnalyzer ML Kit 邊界框錯列 Android ML Kit Firebase FirebaseVisionText，`block.getCornerPoints()`總是`return null`值我可以使用 ML kit 人臉檢測來判斷照片是否包含人臉嗎？如何使用 ML Kit 增加人臉檢測期間的每秒幀數使用Python和OpenCV合並裁剪皮膚和原始自拍照的這兩個圖像？分辨率低的tesseract libjpeg圖像質量差分割邊緣

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM