[英]How to understand the first argument of the Keras Conv2D layer?
我正在关注专家指南的 TensorFlow 2 快速入门指南,并试图理解创建Conv2D
实例的第一个论点。
filters: Integer, the dimensionality of the output space
(i.e. the number of output filters in the convolution).
由于指南对batch
大小和filters
使用相同的32
,选择32
是否有特定原因,这两个参数是否应该始终相互匹配?
train_ds = tf.data.Dataset.from_tensor_slices(
(x_train, y_train)).shuffle(10000).batch(32)
…………
self.conv1 = Conv2D(32, 3, activation='relu')
摘要:
批量大小定义将通过网络传播的样本数量。
过滤器的数量是神经元的数量,因为每个神经元对层的输入执行不同的卷积(更准确地说,神经元的输入权重形成卷积核)。
因此,这些参数不必相同。
一般来说,人们倾向于对神经网络中的不同超参数使用 2 的幂。 没有明确证明它更有效,但有一些思想流派指出它是最有效的方法。 就过滤器的数量而言,过滤器旨在检测特征。 如果添加更多过滤器,它应该能够捕获更复杂的特征,无论是视觉的还是物理的。 增加每一层中过滤器数量的缺点是增加了与之相关的参数。 这会使您的 model 占用更多的 memory,并且由于要更新的参数更多,因此训练需要更长的时间。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.