簡體   English   中英

使用UCI數據集處理Tensorflow數據

[英]Tensorflow data processing using UCI Dataset

我正在嘗試使用Tensorflow來識別UCI數據集的手寫數字( https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwriting+Digits )。 其中每行是圖像像素的扁平8 * 8矩陣,最后一個屬性是類代碼0-9。 但是,我遵循的教程是關於MNIST數據的,這是完全不同的。 它具有值為0-255的28 * 28矩陣。 所以,是這樣的:

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data", one_hot=True)
x = tf.placeholder('float', [None, 784])
y = tf.placeholder('float')

由於我是Tensorflow的新手,所以我無法為UCI數據准備神經網絡模型。 我只想知道如何進行的指導。 我有兩個主要問題。

  1. 這是導入數據的正確方法嗎?
  2. 如何獲得“ y”標簽作為最后一個屬性?

目前,我正在考慮做這樣的事情:

filename_queue = tf.train.string_input_producer(["optdigits.tra"])
reader = tf.TextLineReader()
_, serialized_example = reader.read(filename_queue)
image,label = decode(serialized_example)
x = tf.placeholder('float', [None, 64])
y = tf.placeholder('float')

基本上,我想准備一個具有64個節點的輸入層和一個帶有輸出的'y'標簽,以訓練NN model

我也很新,也許這不是一個好方法。 我使用numpy導入數據,然后將其轉換為張量流格式。

import tensorflow as tf
import numpy as np

trainingDataSet_ = np.loadtxt('/data/optdigits.tra', delimiter=',');
trainingDataSet = tf.convert_to_tensor(trainingDataSet_, np.int32)

# store labels of each sample
y = trainingDataSet[:, 64]

# remove lables from features
x = trainingDataSet[:, :64]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM