用發電機復位 kernel

Question

為什么我的帶有任何 batch_sizes 的生成器的代碼將重置並且我的 Ram 將被填滿

導入一些重要的庫

import tensorflow as tf
import pandas as pd
import matplotlib.pyplot as plt

加載和一些拆分數據

cifar10_data = tf.keras.datasets.cifar10

(train_images, train_labels), (test_images, test_labels) = cifar10_data.load_data()

CLASS_NAMES= ['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']

validation_images, validation_labels = train_images[:5000], train_labels[:5000]
train_images, train_labels = train_images[5000:], train_labels[5000:]

使用 tf.data 表單並構建一些數據對

train_ds = tf.data.Dataset.from_tensor_slices((train_images, train_labels))
test_ds = tf.data.Dataset.from_tensor_slices((test_images, test_labels))
validation_ds = tf.data.Dataset.from_tensor_slices((validation_images, validation_labels))

定義預處理

def process_images(image, label, size=227):
    # Normalize images to have a mean of 0 and standard deviation of 1
    image = tf.image.per_image_standardization(image)
    # Resize images from 32x32 to 277x277
    image = tf.image.resize(image, (227,227))
    return image, label

使用 tf.data 了解數據的大小

train_ds_size = tf.data.experimental.cardinality(train_ds).numpy()
test_ds_size = tf.data.experimental.cardinality(test_ds).numpy()
validation_ds_size = tf.data.experimental.cardinality(validation_ds).numpy()

print("Training data size:", train_ds_size)
print("Test data size:", test_ds_size)
print("Validation data size:", validation_ds_size)

使用 tf.data 方法以批量大小 = 64 生成數據

train_ds = (train_ds
                  .map(process_images)
                  .shuffle(buffer_size=train_ds_size)
                  .batch(batch_size=64, drop_remainder=True))
test_ds = (test_ds
                  .map(process_images)
                  .shuffle(buffer_size=train_ds_size)
                  .batch(batch_size=64, drop_remainder=True))
validation_ds = (validation_ds
                  .map(process_images)
                  .shuffle(buffer_size=train_ds_size)
                  .batch(batch_size=64, drop_remainder=True))

定義 model

model = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(filters=96, kernel_size=(11,11), strides=(4,4), activation='relu', input_shape=(227,227,3)),
    tf.keras.layers.BatchNormalization(),
    tf.keras.layers.MaxPool2D(pool_size=(3,3), strides=(2,2)),
    tf.keras.layers.Conv2D(filters=256, kernel_size=(5,5), strides=(1,1), activation='relu', padding="same"),
    tf.keras.layers.BatchNormalization(),
    tf.keras.layers.MaxPool2D(pool_size=(3,3), strides=(2,2)),
    tf.keras.layers.Conv2D(filters=384, kernel_size=(3,3), strides=(1,1), activation='relu', padding="same"),
    tf.keras.layers.BatchNormalization(),
    tf.keras.layers.Conv2D(filters=384, kernel_size=(3,3), strides=(1,1), activation='relu', padding="same"),
    tf.keras.layers.BatchNormalization(),
    tf.keras.layers.Conv2D(filters=256, kernel_size=(3,3), strides=(1,1), activation='relu', padding="same"),
    tf.keras.layers.BatchNormalization(),
    tf.keras.layers.MaxPool2D(pool_size=(3,3), strides=(2,2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(4096, activation='relu'),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(4096, activation='relu'),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(10, activation='softmax')
])

編譯 model

model.compile(loss='sparse_categorical_crossentropy', optimizer=tf.optimizers.SGD(lr=0.001), metrics=['accuracy'])
# model.summary()

在數據集上擬合 model

history = model.fit(train_ds,
          epochs=1,
          validation_data=validation_ds, verbose=1,
          validation_freq=1)

我怎樣才能毫無問題地使用這樣的代碼生成器實際上我需要在我的代碼中使用生成器來解決 memory 問題但我不知道如何使用這種類型的生成器

Answer 1

你必須減少洗牌緩沖區的大小。

Answer 2

這只是密集層堆疊的原因，其中有太多單元（神經元）會導致溢出和 OOM，據估計，對於這個 model，密集層將包含 37752832 和 16781312 個可訓練參數，這確實是巨大的 model。

所以再次嘗試使用較少的單元來為密集層，注意卷積模型中最重要的是密集層只是用於對提取的特征圖進行分類，因此不需要定義具有這么多單元的密集層，因此強調定義基於卷積基礎的最佳 model。

用發電機復位 kernel

問題描述

2 個解決方案

解決方案1
1 已采納 2022-08-31 09:40:35

解決方案2
0 2022-08-30 15:07:38

用發電機復位 kernel

問題描述

2 個解決方案

解決方案1 1 已采納 2022-08-31 09:40:35

解決方案2 0 2022-08-30 15:07:38

解決方案1
1 已采納 2022-08-31 09:40:35

解決方案2
0 2022-08-30 15:07:38