image - 人工神经网络图像变换

映射复杂性

正如Springfield762所提到的，有许多可能的函数可以从一个图像映射到另一个图像。 如果输入图像和输出图像之间的关系相对简单 - 比如将每个像素的强度增加一定量 - 那么ANN就能够毫不费力地学习这种映射。 可能还有许多转换同样易于学习，例如倾斜，翻转，旋转或翻译图像 - 基本上任何仿射变换都很容易学习。 其他非线性变换也是可行的，例如平方每个像素的强度。

作为一般规则，输入和输出图像之间的关系越复杂，让模型为您学习此映射就越困难。

模型复杂性

从输入到输出的映射越复杂，您的ANN模型就越能够捕获此映射。 在过去10年中，已经展示了具有许多隐藏层的模型，以便在人们以前认为不可能完成的任务上表现得非常好，但这些最先进的模型通常具有数百万甚至数十亿的参数并需要数周时间才能进行训练。 GPU硬件。 一个简单的模型可以捕获许多简单的映射，但是如果你有一个复杂的输入输出映射来学习，你将需要一个庞大的复杂模型。

扩展复杂性

Yves在评论中提到，将模型缩放到典型的图像尺寸可能很困难。 如果您的图像相对较小（目前最先进的是对大小为100x100像素的图像进行建模），那么您可以在ANN模型中抛出一堆原始像素数据，看看会发生什么。 但如果您使用闪亮的尼康数码单反相机中的6000x4000图像，则在合理的时间内处理这些图像将非常困难。 你最好以某种方式压缩图像数据（ PCA是一种常用技术），然后尝试学习压缩空间中的映射。

此外，较大的图像将在它们之间具有更大的可能映射空间，因此您需要比您拥有小图像时更多的较大图像作为训练数据。

Springfield762也提到了这一点：如果您的输入和输出图像之间的映射很简单，那么您只需要几个示例即可成功学习映射。 但是如果你有一个复杂的映射，那么你需要更多的训练数据才有机会正确地学习映射。

实施复杂性

一个已经存在的工具不太可能让您只将图像数据投入到ANN模型中并显示映射。 最有可能的是，您至少需要实现一些预处理图像数据的代码。 另外，如果你有很多大图像，你可能需要编写代码来处理从磁盘加载数据等。（有很多“大数据”工具用于这样的事情，但它们都需要一些努力设置。）

现在有很多很多开源的ANN工具包。 FANN（已经提到过）是C ++中的一种流行的，带有其他语言的绑定。 Caffe很受欢迎，也是用C ++实现的绑定。 似乎有许多工具包使用Python和Theano或其他一些GPU加速库 - Keras ， Lasagne ， Hebel ， Pylearn2 ， neon和Theanets （我写了这个）。 许多人使用用Lua编写的Torch 。 Matlab至少有一个神经网络工具箱。 我对其他生态系统不熟悉，但Java似乎有Deeplearning4j ，C＃有Accord ，甚至R还有darch 。

但是对于任何这些神经网络工具包，您将不得不编写一些代码来加载数据，将其处理为适当的输入格式，构建（或加载）网络模型，训练模型等。