Tensorflow 估計器 ValueError：logits 和標簽必須具有相同的形狀 ((?, 1) vs (?,))

Question

我使用二元交叉熵將電影評論分類為正面或負面。 所以，當我試圖用 tensorflow 估算器包裝我的 keras model 時，我得到了錯誤：

Tensorflow estimator ValueError: logits and labels must have the same shape ((?, 1) vs (?,))

我使用 sigmoid 激活作為我的最后一層，我想我在這里遺漏了一些微不足道的東西。 有什么幫助嗎？

from tensorflow import keras
import tensorflow as tf
print("Tensorflow {} loaded".format(tf.__version__))
import numpy as np

keras.__version__
from keras.datasets import imdb

(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)
def vectorize_sequences(sequences, dimension=10000):
    # Create an all-zero matrix of shape (len(sequences), dimension)
    results = np.zeros((len(sequences), dimension))
    for i, sequence in enumerate(sequences):
        results[i, sequence] = 1.  # set specific indices of results[i] to 1s
    return results.astype('float32')

# Our vectorized training data
x_train = vectorize_sequences(train_data)

# Our vectorized test data
x_test = vectorize_sequences(test_data)

# Our vectorized labels
y_train = np.asarray(train_labels).astype('float32')
y_test = np.asarray(test_labels).astype('float32')

x_val = x_train[:10000]
partial_x_train = x_train[10000:]
y_val = y_train[:10000]
partial_y_train = y_train[10000:]

model = keras.models.Sequential()
model.add(keras.layers.Dense(16, activation='relu', input_shape=(10000,), name='reviews'))
model.add(keras.layers.Dense(16, activation='relu'))
model.add(keras.layers.Dense(1, activation='sigmoid'))
model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['accuracy'])
estimator_model = keras.estimator.model_to_estimator(keras_model=model)

def input_function(features,labels=None,shuffle=False,epochs=None,batch_size=None):
    input_fn = tf.estimator.inputs.numpy_input_fn(
        x={"reviews_input": features},
        y=labels,
        shuffle=shuffle,
        num_epochs=epochs,
        batch_size=batch_size
    )
    return input_fn

estimator_model.train(input_fn=input_function(partial_x_train, partial_y_train, True,20,512))
score = estimator_model.evaluate(input_function(x_val, labels=y_val))
print(score)

Answer 1

您應該將標簽重塑為二維張量（第一個維度將是批次維度，第二個維度是標量標簽）：

# Our vectorized labels
y_train = np.asarray(train_labels).astype('float32').reshape((-1,1))
y_test = np.asarray(test_labels).astype('float32').reshape((-1,1))

Answer 2

如果您正在進行二元分類，請確保最后一個 Dense 層的形狀只有 (None, 1)，而不是 None, 2)

tf.keras.layers.Dense(1, activation="sigmoid") # binary activation output

Answer 3

使用 model.summary() 檢查您的網絡

您最終需要精簡網絡以獲得與您的類相同的輸出。 例如，對數字需求和 Dense(10) 的最終輸出（數字 0 到 9）進行 OCR。

例如表征狗與貓。 最后一層必須有兩個輸出（0-dog，1-cat）

Answer 4

我們可以通過在 Dense 層之后添加一個 Flatten 層，將輸出與標簽的維度進行匹配來解決這個問題：

model.add(Flatten())

或通過添加：

model.add(GlobalAveragePooling2D())

有關完整詳細信息，請參閱此 GitHub 問題

Answer 5

如果你在做二元交叉熵，那么你的數據集可能有 2 個類並且錯誤即將到來，因為你的標簽向量（在測試和訓練中）具有 [0,1,0,1,1,1,0 ,0,1,...]。 要對二進制標簽進行單熱編碼，可以使用以下函數： Labels = tf.one_hot(Labels, depth=2)

Tensorflow 估計器 ValueError：logits 和標簽必須具有相同的形狀 ((?, 1) vs (?,))

問題描述

5 個解決方案

解決方案1
21 已采納 2018-02-18 12:46:36

解決方案2
13 2022-02-18 08:51:35

解決方案3
7 2020-07-04 03:03:33

解決方案4
0 2021-09-28 14:08:08

解決方案5
0 2021-10-21 18:11:46

Tensorflow 估計器 ValueError：logits 和標簽必須具有相同的形狀 ((?, 1) vs (?,))

問題描述

5 個解決方案

解決方案1 21 已采納 2018-02-18 12:46:36

解決方案2 13 2022-02-18 08:51:35

解決方案3 7 2020-07-04 03:03:33

解決方案4 0 2021-09-28 14:08:08

解決方案5 0 2021-10-21 18:11:46

解決方案1
21 已采納 2018-02-18 12:46:36

解決方案2
13 2022-02-18 08:51:35

解決方案3
7 2020-07-04 03:03:33

解決方案4
0 2021-09-28 14:08:08

解決方案5
0 2021-10-21 18:11:46