image - 人工神經網絡圖像變換

映射復雜性

正如Springfield762所提到的，有許多可能的函數可以從一個圖像映射到另一個圖像。 如果輸入圖像和輸出圖像之間的關系相對簡單 - 比如將每個像素的強度增加一定量 - 那么ANN就能夠毫不費力地學習這種映射。 可能還有許多轉換同樣易於學習，例如傾斜，翻轉，旋轉或翻譯圖像 - 基本上任何仿射變換都很容易學習。 其他非線性變換也是可行的，例如平方每個像素的強度。

作為一般規則，輸入和輸出圖像之間的關系越復雜，讓模型為您學習此映射就越困難。

模型復雜性

從輸入到輸出的映射越復雜，您的ANN模型就越能夠捕獲此映射。 在過去10年中，已經展示了具有許多隱藏層的模型，以便在人們以前認為不可能完成的任務上表現得非常好，但這些最先進的模型通常具有數百萬甚至數十億的參數並需要數周時間才能進行訓練。 GPU硬件。 一個簡單的模型可以捕獲許多簡單的映射，但是如果你有一個復雜的輸入輸出映射來學習，你將需要一個龐大的復雜模型。

擴展復雜性

Yves在評論中提到，將模型縮放到典型的圖像尺寸可能很困難。 如果您的圖像相對較小（目前最先進的是對大小為100x100像素的圖像進行建模），那么您可以在ANN模型中拋出一堆原始像素數據，看看會發生什么。 但如果您使用閃亮的尼康數碼單反相機中的6000x4000圖像，則在合理的時間內處理這些圖像將非常困難。 你最好以某種方式壓縮圖像數據（ PCA是一種常用技術），然后嘗試學習壓縮空間中的映射。

此外，較大的圖像將在它們之間具有更大的可能映射空間，因此您需要比您擁有小圖像時更多的較大圖像作為訓練數據。

Springfield762也提到了這一點：如果您的輸入和輸出圖像之間的映射很簡單，那么您只需要幾個示例即可成功學習映射。 但是如果你有一個復雜的映射，那么你需要更多的訓練數據才有機會正確地學習映射。

實施復雜性

一個已經存在的工具不太可能讓您只將圖像數據投入到ANN模型中並顯示映射。 最有可能的是，您至少需要實現一些預處理圖像數據的代碼。 另外，如果你有很多大圖像，你可能需要編寫代碼來處理從磁盤加載數據等。（有很多“大數據”工具用於這樣的事情，但它們都需要一些努力設置。）

現在有很多很多開源的ANN工具包。 FANN（已經提到過）是C ++中的一種流行的，帶有其他語言的綁定。 Caffe很受歡迎，也是用C ++實現的綁定。 似乎有許多工具包使用Python和Theano或其他一些GPU加速庫 - Keras ， Lasagne ， Hebel ， Pylearn2 ， neon和Theanets （我寫了這個）。 許多人使用用Lua編寫的Torch 。 Matlab至少有一個神經網絡工具箱。 我對其他生態系統不熟悉，但Java似乎有Deeplearning4j ，C＃有Accord ，甚至R還有darch 。

但是對於任何這些神經網絡工具包，您將不得不編寫一些代碼來加載數據，將其處理為適當的輸入格式，構建（或加載）網絡模型，訓練模型等。