[英]L2 matrix rowwise normalization gradient
我试图为卷积神经网络实现L2范数层,并且陷入了向后的障碍:
def forward(self, inputs):
x, = inputs
self._norm = np.expand_dims(np.linalg.norm(x, ord=2, axis=1), axis=1)
z = np.divide(x, self._norm)
return z,
def backward(self, inputs, grad_outputs):
x, = inputs
gz, = grad_outputs
gx = None # how to compute gradient here?
return gx,
如何计算gx? 我的第一个猜测是
gx = - gz * x / self._norm**2
但这似乎是错误的。
正确的答案是
gx = np.divide(gz, self._norm)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.