Keras model.fit ValueError：输入数组的样本数应与目标数组相同

Question

我正在尝试将通过运行resnet50获得的bottleneck_features加载到顶层模型中。 我在resnet上运行了predict_generator，并将生成的bottleneck_features保存到一个npy文件中。 由于出现以下错误，我无法拟合我创建的模型：

    Traceback (most recent call last):
  File "Labeled_Image_Recognition.py", line 119, in <module>
    callbacks=[checkpointer])
  File "/home/dillon/anaconda3/envs/tensorflow/lib/python3.6/site-packages/keras/models.py", line 963, in fit
    validation_steps=validation_steps)
  File "/home/dillon/anaconda3/envs/tensorflow/lib/python3.6/site-packages/keras/engine/training.py", line 1630, in fit
    batch_size=batch_size)
  File "/home/dillon/anaconda3/envs/tensorflow/lib/python3.6/site-packages/keras/engine/training.py", line 1490, in _standardize_user_data
    _check_array_lengths(x, y, sample_weights)
  File "/home/dillon/anaconda3/envs/tensorflow/lib/python3.6/site-packages/keras/engine/training.py", line 220, in _check_array_lengths
    'and ' + str(list(set_y)[0]) + ' target samples.')
ValueError: Input arrays should have the same number of samples as target arrays. Found 940286 input samples and 14951 target samples.

我不太确定这是什么意思。 我的火车目录中总共有940286个图像，这些图像被分为14951个子目录。 我的两个假设是：

我可能未正确格式化train_data和train_labels。
我建立模型不正确

任何正确方向的指导将不胜感激！

这是代码：

# Constants
num_train_dirs = 14951 #This is the total amount of classes I have
num_valid_dirs = 13168 

def load_labels(path):
    targets = os.listdir(path)
    labels = np_utils.to_categorical(targets, len(targets))
    return labels

def create_model(train_data):
    model = Sequential()
    model.add(Flatten(input_shape=train_data.shape[1:]))
    model.add(Dense(num_train_dirs, activation='relu'))
    model.add(Dropout(0.2))
    model.add(Dense(num_train_dirs, activation='softmax'))
    model.compile(loss='categorical_crossentropy', optimizer='rmsprop', metrics=['accuracy'])
    return model    

train_data = np.load(open('bottleneck_features/bottleneck_features_train.npy', 'rb'))
train_labels = load_labels(raid_train_dir)

valid_data = np.load(open('bottleneck_features/bottleneck_features_valid.npy', 'rb'))
valid_labels = train_labels

model = create_model(train_data)
model.summary()

checkpointer = ModelCheckpoint(filepath='weights/first_try.hdf5', verbose=1, save_best_only=True)

print("Fitting model...")

model.fit(train_data, train_labels,
     epochs=50,
     batch_size=100,
     verbose=1,
     validation_data=(valid_data, valid_labels),
     callbacks=[checkpointer])

Answer 1

在监督学习输入采样（的数目的情况下， X ）必须样品（输出（标签）的数量匹配Y ）。

例如：如果我们要适合（学习）NN以识别手写数字，并且将10.000张图像（ X ）输入到模型中，那么我们还应该传递10.000张标签（ Y ）。

在您的情况下，这些数字不匹配。

Keras model.fit ValueError：输入数组的样本数应与目标数组相同

问题描述

1 个解决方案

解决方案1
0 已采纳 2018-04-28 22:07:17

Keras model.fit ValueError：输入数组的样本数应与目标数组相同

问题描述

1 个解决方案

解决方案1 0 已采纳 2018-04-28 22:07:17

解决方案1
0 已采纳 2018-04-28 22:07:17