MNIST numpy 神經網絡准確率徘徊在 10%

Question

嗨，我一直在研究神經網絡來處理 MNIST 數據集，但是當我運行代碼時，准確度開始增加，但最終達到 0.098 准確度，在計算 SoftMax 值時，我還在 exp 中遇到溢出錯誤。 我試圖調試我的代碼，但我不明白我哪里出錯了。 如果有人能指出我正確的方向，那就太好了，如果您找不到錯誤，您能否給我任何有關嘗試調試此問題的技術提示。 提前致謝。

import numpy as np
import pandas as pd
df = pd.read_csv('../input/digit-recognizer/train.csv')
data = np.array(df.values)
data = data.T
data
Y = data[0,:]
X = data[1:,:]
Y_train = Y[:41000]
X_train = X[:,:41000]
X_train = X_train/255
Y_val = Y[41000:]
X_val = X[:,41000:]
X_val = X_val/255
print(np.max(X_train))
class NeuralNetwork:
    def __init__(self, n_in, n_out):
        self.w1, self.b1 = self.Generate_Weights_Biases(10,784)
        self.w2, self.b2 = self.Generate_Weights_Biases(10,10)
    def Generate_Weights_Biases(self, n_in, n_out):
        weights = 0.01*np.random.randn(n_in, n_out)
        biases = np.zeros((n_in,1))
        return weights, biases
    def forward(self, X):
        self.Z1 = self.w1.dot(X) + self.b1
        self.a1 = self.ReLu(self.Z1)
        self.z2 = self.w2.dot(self.a1) + self.b2
        y_pred = self.Softmax(self.z2)
        return y_pred
    def ReLu(self, Z):
        return np.maximum(Z,0)
    def Softmax(self, Z):
        #exponentials = np.exp(Z)
        #sumexp = np.sum(np.exp(Z), axis=0) 
        #print(Z)
        return np.exp(Z)/np.sum(np.exp(Z))
        
    def ReLu_Derv(self, x):
        return np.greaterthan(x, 0).astype(int)
    def One_hot_encoding(self, Y):
        one_hot = np.zeros((Y.size, 10))
        rows = np.arange(Y.size)
        one_hot[rows, Y] = 1
        one_hot = one_hot.T
        return one_hot
    def Get_predictions(self, y_pred):
        return np.argmax(y_pred, 0)
    def accuracy(self, pred, Y):
        return np.sum(pred == Y)/Y.size
    def BackPropagation(self, X, Y, y_pred, lr=0.01):
        m = Y.size
        one_hot_y = self.One_hot_encoding(Y)
        e2 = y_pred - one_hot_y
        derW2 = (1/m)* e2.dot(self.a1.T)
        derB2 =(1/m) * e2
        #derB2 = derB2.reshape(10,1)
        e1 = self.w2.T.dot(e2) * self.ReLu(self.a1)
        derW1 = (1/m) * e1.dot(X.T)
        derB1 = (1/m) * e1
        #derB1 = derB1.reshape(10,1)
        self.w1 = self.w1 - lr*derW1
        self.b1 = self.b1 - lr*np.sum(derB1, axis=1, keepdims=True)
        self.w2 = self.w2 - lr*derW2
        self.b2 = self.b2 - lr*np.sum(derB2, axis=1, keepdims=True)
    def train(self, X, Y, epochs = 1000):
        for i in range(epochs):
            y_pred = self.forward(X)
            predict = self.Get_predictions(y_pred)
            accuracy = self.accuracy(predict, Y)
            print(accuracy)
            self.BackPropagation(X, Y, y_pred)
        return self.w1, self.b1, self.w2, self.b2
    
NN = NeuralNetwork(X_train, Y_train)
w1,b1,w2,b2 = NN.train(X_train,Y_train)

Answer 1

我發現以下錯誤：

您的 softmax 實現無法正常工作，因為您獲得了對潛在的大數進行取冪以獲得 0 到 1 之間的值的嚴重數字錯誤。此外，您忘記在分母中指定求和軸。 這是一個有效的實現：

    def Softmax(self, Z):
        e = np.exp(Z - Z.max(axis=0, keepdims=True))
        return e/e.sum(axis=0, keepdims=True)

（在這里和下面我跳過了在這種情況下不是必需的編碼風格的評論。就像這應該是一個類方法或一個獨立的函數等。）

您的 ReLu 衍生實現對我根本不起作用。 可能是我有不同的numpy版本。 這個有效：

    def ReLu_Derv(self, x):
        return (x > 0).astype(int)

您需要在BackPropagation中實際使用此實現：

        e1 = self.w2.T.dot(e2) * self.ReLu_Derv(self.a1)

通過這些修改，在 LR=0.1 的 100 次迭代后，我設法達到了 91.0% 的准確率。 我使用以下代碼從 Keras 加載了 MNIST：

(train_images, train_labels), (test_images, test_labels) = tf.keras.datasets.mnist.load_data()
X = train_images.reshape(-1, 28*28).T
Y = train_labels

MNIST numpy 神經網絡准確率徘徊在 10%

問題描述

1 個解決方案

解決方案1
0 已采納 2022-07-12 20:49:34

MNIST numpy 神經網絡准確率徘徊在 10%

問題描述

1 個解決方案

解決方案1 0 已采納 2022-07-12 20:49:34

解決方案1
0 已采納 2022-07-12 20:49:34