繁体   English   中英

在 Tensorflow 中实现一个扁平层

[英]Implement a flatten layer in Tensorflow

我正在尝试使用 TensorFlow 2.2.0 实现一个扁平层。 我正在按照 Geron 的书(第 2 版)中的说明进行操作。 至于扁平层,我首先尝试获取批量输入形状并计算新形状。 但是我在张量维度上遇到了这个问题: TypeError: Dimension value must be integer or None or have an __index__ method

import tensorflow as tf
from tensorflow import keras
(X_train, y_train), (X_test, y_test) = keras.datasets.fashion_mnist.load_data()
input_shape = X_train.shape[1:]
assert input_shape == (28, 28)

class MyFlatten(keras.layers.Layer):
    def __init__(self, **kwargs):
        super().__init__(**kwargs)

    def build(self, batch_input_shape):
        super().build(batch_input_shape) 

    def call(self, X):
        X_shape = tf.shape(X)
        batch_size = X_shape[0]
        new_shape = tf.TensorShape([batch_size, X_shape[1]*X_shape[2]])
        return tf.reshape(X, new_shape)

    def get_config(self):
        base_config = super().get_config()
        return {**base_config}

## works fine on this example
MyFlatten()(X_train[:10])

## fail when building a model
input_ = keras.layers.Input(shape=[28, 28])
fltten_ = MyFlatten()(input_)
hidden1 = keras.layers.Dense(300, activation="relu")(fltten_)
hidden2 = keras.layers.Dense(100, activation="relu")(hidden1)
output = keras.layers.Dense(10, activation="softmax")(hidden2)
model = keras.models.Model(inputs=[input_], outputs=[output])
model.summary()

不要尝试创建tf.TensorShape ,它仅在已知张量的所有维度时才有效,实际上仅在急切模式下,因此 model 编译将失败。 像这样简单地重塑:

def call(self, X):
    X_shape = tf.shape(X)
    batch_size = X_shape[0]
    new_shape = [batch_size, X_shape[1] * X_shape[2]]
    return tf.reshape(X, new_shape)

或者,更一般地说,您可以这样做:

def call(self, X):
    X_shape = tf.shape(X)
    batch_size = X_shape[0]
    new_shape = [batch_size, tf.math.reduce_prod(X_shape[1:])]
    return tf.reshape(X, new_shape)

tf.reshape也会接受类似new_shape = [batch_size, -1]的东西,但我认为这可能会使展平尺寸的大小未知,具体取决于具体情况。 另一方面,相反的东西new_shape = [-1, tf.math.reduce_prod(X_shape[1:])]也应该可以正常工作。

顺便说一句,我假设您这样做是为了练习并且已经知道这一点,但仅供参考,Keras 中已经有一个Flatten层(您可以查看它的源代码)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM