神經網絡正弦近似

Question

在花費數天未能使用神經網絡進行 Q 學習之后，我決定回歸基礎並做一個簡單的函數近似，以查看一切是否正常工作，並查看某些參數如何影響學習過程。 這是我想出的代碼

from keras.models import Sequential
from keras.layers import Dense
import matplotlib.pyplot as plt
import random
import numpy
from sklearn.preprocessing import MinMaxScaler

regressor = Sequential()
regressor.add(Dense(units=20, activation='sigmoid', kernel_initializer='uniform', input_dim=1))
regressor.add(Dense(units=20, activation='sigmoid', kernel_initializer='uniform'))
regressor.add(Dense(units=20, activation='sigmoid', kernel_initializer='uniform'))
regressor.add(Dense(units=1))
regressor.compile(loss='mean_squared_error', optimizer='sgd')
#regressor = ExtraTreesRegressor()

N = 5000
X = numpy.empty((N,))
Y = numpy.empty((N,))

for i in range(N):
    X[i] = random.uniform(-10, 10)
X = numpy.sort(X).reshape(-1, 1)

for i in range(N):
    Y[i] = numpy.sin(X[i])
Y = Y.reshape(-1, 1)

X_scaler = MinMaxScaler()
Y_scaler = MinMaxScaler()
X = X_scaler.fit_transform(X)
Y = Y_scaler.fit_transform(Y)

regressor.fit(X, Y, epochs=2, verbose=1, batch_size=32)
#regressor.fit(X, Y.reshape(5000,))

x = numpy.mgrid[-10:10:100*1j]
x = x.reshape(-1, 1)
y = numpy.mgrid[-10:10:100*1j]
y = y.reshape(-1, 1)
x = X_scaler.fit_transform(x)

for i in range(len(x)):
    y[i] = regressor.predict(numpy.array([x[i]]))

plt.figure()
plt.plot(X_scaler.inverse_transform(x), Y_scaler.inverse_transform(y))
plt.plot(X_scaler.inverse_transform(X), Y_scaler.inverse_transform(Y))

問題是我所有的預測值都在 0 左右。 如您所見，我使用了 sklearn（注釋行）中的 ExtraTreesRegressor 來檢查協議是否確實正確。 那么我的神經網絡有什么問題呢？ 為什么它不起作用？

（我試圖解決的實際問題是使用神經網絡計算山地車問題的 Q 函數。它與這個函數逼近器有什么不同？）

Answer 1

有了這些變化：

relu激活
刪除kernel_initializer （即保留默認的'glorot_uniform' ）
亞當優化器
100個時代

即

regressor = Sequential()
regressor.add(Dense(units=20, activation='relu', input_dim=1)) 
regressor.add(Dense(units=20, activation='relu')) 
regressor.add(Dense(units=20, activation='relu')) 
regressor.add(Dense(units=1))
regressor.compile(loss='mean_squared_error', optimizer='adam')

regressor.fit(X, Y, epochs=100, verbose=1, batch_size=32)

其余代碼不變，結果如下：

廷克，一次又一次……

Answer 2

更簡潔的代碼版本：

def data_gen():
    while True:
        x = (np.random.random([1024])-0.5) * 10 
        y = np.sin(x)
        yield (x,y)

regressor = Sequential()
regressor.add(Dense(units=20, activation='tanh', input_dim=1))
regressor.add(Dense(units=20, activation='tanh'))
regressor.add(Dense(units=20, activation='tanh'))
regressor.add(Dense(units=1, activation='linear'))
regressor.compile(loss='mse', optimizer='adam')

regressor.fit_generator(data_gen(), epochs=3, steps_per_epoch=128)

x = (np.random.random([1024])-0.5)*10
x = np.sort(x)
y = np.sin(x)

plt.plot(x, y)
plt.plot(x, regressor.predict(x))
plt.show()

所做的更改：用雙曲正切替換低層激活，用隨機生成器替換靜態數據集，用 adam 替換 sgd。 也就是說，您的代碼的其他部分仍然存在我無法找到的問題（很可能是您的縮放器和隨機過程）。

Answer 3

通過更改架構和訓練，我設法獲得了一個很好的近似值，如下面的代碼所示。 這有點矯枉過正，但至少我知道問題出在哪里。

from keras.models import Sequential
from keras.layers import Dense
import matplotlib.pyplot as plt
import random
import numpy
from sklearn.preprocessing import MinMaxScaler
from sklearn.ensemble import ExtraTreesRegressor
from keras import optimizers

regressor = Sequential()
regressor.add(Dense(units=500, activation='sigmoid', kernel_initializer='uniform', input_dim=1))
regressor.add(Dense(units=500, activation='sigmoid', kernel_initializer='uniform'))
regressor.add(Dense(units=1, activation='sigmoid'))
regressor.compile(loss='mean_squared_error', optimizer='adam')
#regressor = ExtraTreesRegressor()

N = 5000

X = numpy.empty((N,))
Y = numpy.empty((N,))

for i in range(N):
    X[i] = random.uniform(-10, 10)

X = numpy.sort(X).reshape(-1, 1)

for i in range(N):
    Y[i] = numpy.sin(X[i])

Y = Y.reshape(-1, 1)

X_scaler = MinMaxScaler()
Y_scaler = MinMaxScaler()
X = X_scaler.fit_transform(X)
Y = Y_scaler.fit_transform(Y)

regressor.fit(X, Y, epochs=50, verbose=1, batch_size=2)
#regressor.fit(X, Y.reshape(5000,))

x = numpy.mgrid[-10:10:100*1j]
x = x.reshape(-1, 1)
y = numpy.mgrid[-10:10:100*1j]
y = y.reshape(-1, 1)
x = X_scaler.fit_transform(x)
for i in range(len(x)):
    y[i] = regressor.predict(numpy.array([x[i]]))


plt.figure()
plt.plot(X_scaler.inverse_transform(x), Y_scaler.inverse_transform(y))
plt.plot(X_scaler.inverse_transform(X), Y_scaler.inverse_transform(Y))

然而，我仍然感到困惑的是，我發現一些論文說他們只使用兩個隱藏層的五個神經元來近似山地車問題的 Q 函數，並且只訓練他們的網絡幾分鍾就得到了很好的結果。 我將嘗試在我的原始問題中更改我的批量大小，看看我能得到什么結果，但我不是很樂觀

神經網絡正弦近似

問題描述

3 個解決方案

解決方案1
5 已采納 2018-03-31 12:02:47

解決方案2
1 2018-03-31 11:40:45

解決方案3
0 2018-03-31 12:06:31

神經網絡正弦近似

問題描述

3 個解決方案

解決方案1 5 已采納 2018-03-31 12:02:47

解決方案2 1 2018-03-31 11:40:45

解決方案3 0 2018-03-31 12:06:31

解決方案1
5 已采納 2018-03-31 12:02:47

解決方案2
1 2018-03-31 11:40:45

解決方案3
0 2018-03-31 12:06:31