[英]deep learning for 3d segmentation
我在同一位置拍攝了 20 張心臟圖像,其中有 50 張圖像。 因此,20 張圖像是一個輸入,而我有 50 個輸入。 因為心在動,所有的圖像都不一樣。 我想將這些圖像作為輸入,然后使用深度學習將二進制掩碼圖像分割為輸出。
我將我的輸入視為 3D,並在網上找到了很多 3D CNN 或 FCN。 但這些是 x,y,z 3D 的情況。 我的情況是x,y,t。
有什么建議嗎?
這個問題類似於視頻對象分割,其中需要利用跨幀的時間信息對視頻中的多個幀進行語義分割。 在您的情況下,每組輸入圖像都可以被認為是一個20 幀的視頻,數據集包含50 個視頻,您可以使用有監督、半監督或無監督的視頻對象分割模型(取決於獲取地面實況的可用性/成本)面具)。 該公式解決了使用 FCN 按(x,y,t)
順序分割輸入圖像堆棧的任務。
以下是我在與視頻對象分割相關的研究工作中找到的參考資料:
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.