检查输入时出错：预期 conv2d_input 有 4 个维度，但得到了形状为 (28708, 1) 的数组

Question

我有一个数据集，看起来像：

  emotion   images
0   0      [[70, 80, 82, 72, 58, 58, 60, 63, 54, 58, 60, ...
1   0      [[151, 150, 147, 155, 148, 133, 111, 140, 170,...
2   2      [[231, 212, 156, 164, 174, 138, 161, 173, 182,...
3   4      [[24, 32, 36, 30, 32, 23, 19, 20, 30, 41, 21, ...
4   6      [[4, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 3, 15, 2...

情感列是一个分类变量，图像包含代表图像的 numpy 数组（大小 = (48, 48)）。

我的任务是图像分类，为此我使用了 keras。

当我尝试：

model.fit(df['images'], df['emotion'], epochs= 10, batch_size = 32)

我收到一个值错误：

ValueError：检查输入时出错：预期 conv2d_1_input 有 4 个维度，但得到了形状为 (28708, 1) 的数组

我知道fit()需要 numpy 对象，我尝试使用此处建议的 'df.values' 。 但这对我来说真的不起作用。

我想以一种方式进行预处理，同时批量处理大小为 32 的输入。我不知道如何从这里预处理或重塑我的数据，以便我可以使用 keras 在我的网络上训练它。

如何将我的数据更改为我的网络预期的 4 个维度？

model.summary()

    _________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d_7 (Conv2D)            (None, 46, 46, 64)        640       
_________________________________________________________________
activation_7 (Activation)    (None, 46, 46, 64)        0         
_________________________________________________________________
conv2d_8 (Conv2D)            (None, 44, 44, 32)        18464     
_________________________________________________________________
activation_8 (Activation)    (None, 44, 44, 32)        0         
_________________________________________________________________
max_pooling2d_4 (MaxPooling2 (None, 22, 22, 32)        0         
_________________________________________________________________
conv2d_9 (Conv2D)            (None, 20, 20, 32)        9248      
_________________________________________________________________
activation_9 (Activation)    (None, 20, 20, 32)        0         
_________________________________________________________________
conv2d_10 (Conv2D)           (None, 18, 18, 32)        9248      
_________________________________________________________________
activation_10 (Activation)   (None, 18, 18, 32)        0         
_________________________________________________________________
max_pooling2d_5 (MaxPooling2 (None, 9, 9, 32)          0         
_________________________________________________________________
conv2d_11 (Conv2D)           (None, 7, 7, 32)          9248      
_________________________________________________________________
activation_11 (Activation)   (None, 7, 7, 32)          0         
_________________________________________________________________
conv2d_12 (Conv2D)           (None, 5, 5, 32)          9248      
_________________________________________________________________
activation_12 (Activation)   (None, 5, 5, 32)          0         
_________________________________________________________________
max_pooling2d_6 (MaxPooling2 (None, 2, 2, 32)          0         
_________________________________________________________________
flatten_1 (Flatten)          (None, 128)               0         
_________________________________________________________________
dense_1 (Dense)              (None, 128)               16512     
_________________________________________________________________
activation_13 (Activation)   (None, 128)               0         
_________________________________________________________________
dense_2 (Dense)              (None, 7)                 903       
_________________________________________________________________
activation_14 (Activation)   (None, 7)                 0         
=================================================================
Total params: 73,511
Trainable params: 73,511
Non-trainable params: 0

我的型号代码：

model = Sequential()
model.add(Conv2D(64, (3,3), input_shape = (48, 48, 1)))
model.add(Activation('relu'))
model.add(Conv2D(32, (3,3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Conv2D(32, (3,3)))
model.add(Activation('relu'))
model.add(Conv2D(32, (3,3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))

model.add(Conv2D(32, (3,3)))
model.add(Activation('relu'))
model.add(Conv2D(32, (3,3)))
model.add(Activation('relu'))
model.add(MaxPooling2D (pool_size = (2, 2)))


model.add(Flatten())
model.add(Dense(units = 128))
model.add(Activation('relu'))
model.add(Dense(units= 7))
model.add(Activation('softmax'))
model.compile(optimizer = 'adam', loss = 'categorical_crossentropy', metrics = ['accuracy'])

Answer 1

如果您想使用分类交叉熵，您应该对标签执行一次性编码。 所以y形状应该等于(28709, K) ，其中K - 是一些情绪（我想K=7在你的情况下）。
我不完全理解为什么 python 说df['images']有形状(28708, 1) 。 我想这个列被解释为一维列表数组。 如果我是对的，您必须以正确的方式将df['images']转换为 numpy 3d 数组。
您还必须在 resultin 3D 数组的末尾添加额外的通道维度。 我假设你的图像是灰度的。 这就是为什么在您的情况下最后一个维度大小等于 1。

要解决问题 2-3，您必须像这样执行 smth：

np.expand_dims(np.array(df['images'].tolist()), axis=3)

Answer 2

你可以尝试这样的事情，然后 fit() 数据

df['images'] = np.array(df['images'].values.tolist()).reshape((-1, 48, 48, 1)

它将形状从(28708,1)更改为(28708, 48, 48, 1)因为 conv2d 需要 4D 数组 [ total_Items, rows, cols, channel ]

检查输入时出错：预期 conv2d_input 有 4 个维度，但得到了形状为 (28708, 1) 的数组

问题描述

2 个解决方案

解决方案1
1 2018-09-17 21:21:17

解决方案2
0 2020-01-07 15:19:38

检查输入时出错：预期 conv2d_input 有 4 个维度，但得到了形状为 (28708, 1) 的数组

问题描述

2 个解决方案

解决方案1 1 2018-09-17 21:21:17

解决方案2 0 2020-01-07 15:19:38

解决方案1
1 2018-09-17 21:21:17

解决方案2
0 2020-01-07 15:19:38