使用UCI數據集處理Tensorflow數據

Question

我正在嘗試使用Tensorflow來識別UCI數據集的手寫數字（ https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwriting+Digits ）。 其中每行是圖像像素的扁平8 * 8矩陣，最后一個屬性是類代碼0-9。 但是，我遵循的教程是關於MNIST數據的，這是完全不同的。 它具有值為0-255的28 * 28矩陣。 所以，是這樣的：

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data", one_hot=True)
x = tf.placeholder('float', [None, 784])
y = tf.placeholder('float')

由於我是Tensorflow的新手，所以我無法為UCI數據准備神經網絡模型。 我只想知道如何進行的指導。 我有兩個主要問題。

這是導入數據的正確方法嗎？
如何獲得“ y”標簽作為最后一個屬性？

目前，我正在考慮做這樣的事情：

filename_queue = tf.train.string_input_producer(["optdigits.tra"])
reader = tf.TextLineReader()
_, serialized_example = reader.read(filename_queue)
image,label = decode(serialized_example)
x = tf.placeholder('float', [None, 64])
y = tf.placeholder('float')

基本上，我想准備一個具有64個節點的輸入層和一個帶有輸出的'y'標簽，以訓練NN model 。

Answer 1

我也很新，也許這不是一個好方法。 我使用numpy導入數據，然后將其轉換為張量流格式。

import tensorflow as tf
import numpy as np

trainingDataSet_ = np.loadtxt('/data/optdigits.tra', delimiter=',');
trainingDataSet = tf.convert_to_tensor(trainingDataSet_, np.int32)

# store labels of each sample
y = trainingDataSet[:, 64]

# remove lables from features
x = trainingDataSet[:, :64]

使用UCI數據集處理Tensorflow數據

問題描述

1 個解決方案

解決方案1
1 已采納 2018-05-17 18:23:27

使用UCI數據集處理Tensorflow數據

問題描述

1 個解決方案

解決方案1 1 已采納 2018-05-17 18:23:27

解決方案1
1 已采納 2018-05-17 18:23:27