在python中构建自定义Caffe层

Question

解析了许多关于在Python中构建Caffe图层的链接后，我仍然难以理解一些概念。 有人可以澄清一下吗？

这里解释了网络的Blob和权重python结构：找到关于输入的Caffe conv-filter的梯度。
网络和解算器结构在这里解释： caffe / pycaffe的备忘单？ 。
定义python层的示例如下： git上的pyloss.py 。
这里的层测试： git上的测试层。
这里描述了为C ++开发新层的方法： git wiki 。

我仍然缺少的是：

setup()方法：我应该在这做什么？ 为什么在例子中我应该将'底部'参数的长度与'2'进行比较？ 为什么它应该是2？ 它似乎不是批量大小，因为它是随意的？ 据我所知，底部是blob，然后第一个维度是批量大小？
reshape()方法：据我所知'底部'输入参数是下层的blob，'top'参数是上层的blob，我需要根据我的计算的输出形状使用正向传递重塑顶层。 但是，如果这些形状不是从传递变为传球，只有重量变化，为什么我需要在每个前进传球中执行此操作？
reshape和forward方法使用了'top'输入参数的0个索引。 为什么我需要使用top[0].data=...或top[0].input=...而不是top.data=...和top.input=... ？ 这个指数怎么样？ 如果我们不使用此顶级列表的其他部分，为什么以这种方式暴露它？ 我可以怀疑它或C ++骨干的巧合，但确切地知道它会很好。
reshape()方法，行：
```
 if bottom[0].count != bottom[1].count 
```
我在这做什么 为什么它的尺寸又是2？ 我在这里算什么？ 为什么blob（0和1）的两个部分在某些成员（ count ）的数量上应该相等？
forward()方法，我在这行中定义的：
```
 self.diff[...] = bottom[0].data - bottom[1].data 
```
如果我定义它，在前进路径后使用它？ 我们可以使用吗？
```
 diff = bottom[0].data - bottom[1].data 
```
相反，在这个方法中稍后计算损失，而不是分配给self ，或者它是否有某种目的？
backward()方法：这是关于什么的： for i in range(2): ：？ 为什么范围又是2？
backward()方法， propagate_down参数：为什么定义？ 我的意思是如果它的True，渐变应该被分配给我的bottom[X].diff ，但是为什么有人会调用一些方法，如果它什么都不做并且仍然在里面循环，它会对propagate_down = False无效。

对不起，如果这些问题太明显了，我就无法找到一个好的指南来理解它们并在这里寻求帮助。

Answer 1

你在这里问了很多问题，我会给你一些亮点和指示，希望能为你澄清一些问题。 我不会明确回答你的所有问题。

看起来你对blob和图层的输入/输出之间的区别最为困惑。 事实上，大多数的层具有单个斑点作为输入和单个斑点作为输出，但它并非总是如此。 考虑一个损失层：它有两个输入：预测和地面实况标签。 因此，在这种情况下， bottom是长度为2 （！）的向量， bottom[0]是表示预测的（4-D）斑点，而bottom[1]是带有标签的另一个斑点。 因此，在构建这样的图层时，您必须确定您具有完全（硬编码）的2个输入blob（例如，参见AccuracyLayer定义中的ExactNumBottomBlobs() ）。

对于top blob也是如此：在大多数情况下，每层都有一个top ，但并非总是如此（参见例如AccuracyLayer ）。 因此， top也是4-D blob的向量，每个top一个blob。 大多数情况下，该向量中只有一个元素，但有时您可能会找到多个元素。

我相信这涵盖了您的问题1,3,4和6。

从reshape() （Q.2）开始，每次正向传递都不会调用此函数，只有在设置net以为输入/输出和参数分配空间时才会调用此函数。
有时，您可能希望更改网络的输入大小（例如，对于检测网络），然后您需要为网络的所有层调用reshape()以适应新的输入大小。

至于propagate_down参数（Q.7）：由于一个图层可能有一个以上的bottom ，原则上你需要在backprop期间将渐变传递给所有 bottom 。 但是，损耗层label底部的渐变是什么意思？ 有些情况下，您不希望传播到所有 bottom ：这是此标志的用途。 （这是一个带有三个bottom s的损失层的示例，期望所有这些都具有渐变）。

有关更多信息，请参阅此"Python"图层教程。

Answer 2

为什么它应该是2？

那个具体的要点是谈论欧几里德损失层。 欧几里德损失是2个向量之间的均方误差。 因此，输入blob中必须有2个向量到此层。 每个向量的长度必须相同，因为它是元素差异。 您可以在重塑方法中看到此检查。

谢谢。

在python中构建自定义Caffe层

问题描述

2 个解决方案

解决方案1
17 已采纳 2015-11-19 06:56:26

解决方案2
0 2016-04-02 05:42:12

在python中构建自定义Caffe层

问题描述

2 个解决方案

解决方案1 17 已采纳 2015-11-19 06:56:26

解决方案2 0 2016-04-02 05:42:12

解决方案1
17 已采纳 2015-11-19 06:56:26

解决方案2
0 2016-04-02 05:42:12