我怎樣才能正確地創建我的數據集？

Question

我有以下代碼：

imagepaths = tf.convert_to_tensor(imagepaths, dtype=tf.string)
labels = tf.convert_to_tensor(labels, dtype=tf.int32)

# Build a TF Queue, shuffle data
image, label = tf.data.Dataset.from_tensor_slices((imagepaths, labels))

並收到以下錯誤：

image, label = tf.data.Dataset.from_tensor_slices((imagepaths, labels))
ValueError: too many values to unpack (expected 2)

Dataset.from_tensor_slices 不應該將其視為張量的長度，而不是輸入的數量嗎？ 如何更有效地解決此問題或將數據張量組合到同一變量中？ 僅供參考：有1800個圖像路徑和1800個標簽相互對應。 需要明確的是，圖像路徑是 jpg 圖像所在文件的路徑。 我的目標是打亂數據集並構建神經網絡模型。

該代碼就在這里： # 從磁盤讀取圖像 image = tf.read_file(image) image = tf.image.decode_jpeg(image, channels=CHANNELS)

# Resize images to a common size
image = tf.image.resize_images(image, [IMG_HEIGHT, IMG_WIDTH])

# Normalize
image = image * 1.0/127.5 - 1.0

# Create batches
X, Y = tf.train.batch([image, label], batch_size=batch_size,
                      capacity=batch_size * 8,
                      num_threads=4)

Answer 1

嘗試這樣做：

def transform(entry):
  img = entry[0]
  lbl = entry[1]

  return img, lbl

raw_data = list(zip(imagepaths, labels))
dataset = tf.data.Dataset.from_tensor_slices(raw_data)
dataset = dataset.map(transform)

如果你想看看你的數據集，你可以這樣做：

for e in dataset.take(1):
    print(e)

您可以添加多個地圖函數，然后您可以在數據集上使用 shuffle 和批處理來准備訓練；)

我怎樣才能正確地創建我的數據集？

問題描述

1 個解決方案

解決方案1
0 2020-04-02 19:33:34

我怎樣才能正確地創建我的數據集？

問題描述

1 個解決方案

解決方案1 0 2020-04-02 19:33:34

解決方案1
0 2020-04-02 19:33:34