機器學習模型過擬合

Question

所以我建立了一個 GRU 模型，我在同一個模型上比較了 3 個不同的數據集。 我只是在運行第一個數據集並將 epoch 數設置為 25，但我注意到我的驗證損失在第 6 個 epoch 之后增加，這不表明過度擬合，我做錯了什么嗎？

import pandas as pd
import tensorflow as tf
from keras.layers.core import Dense
from keras.layers.recurrent import GRU
from keras.models import Sequential
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
from google.colab import files
from tensorboardcolab import TensorBoardColab, TensorBoardColabCallback
tbc=TensorBoardColab() # Tensorboard


df10=pd.read_csv('/content/drive/My Drive/Isolation Forest/IF 10 PERCENT.csv',index_col=None)
df2_10= pd.read_csv('/content/drive/My Drive/2019 Dataframe/2019 10minutes IF 10 PERCENT.csv',index_col=None)

X10_train= df10[['WindSpeed_mps','AmbTemp_DegC','RotorSpeed_rpm','RotorSpeedAve','NacelleOrientation_Deg','MeasuredYawError','Pitch_Deg','WindSpeed1','WindSpeed2','WindSpeed3','GeneratorTemperature_DegC','GearBoxTemperature_DegC']]
X10_train=X10_train.values

y10_train= df10['Power_kW']
y10_train=y10_train.values

X10_test= df2_10[['WindSpeed_mps','AmbTemp_DegC','RotorSpeed_rpm','RotorSpeedAve','NacelleOrientation_Deg','MeasuredYawError','Pitch_Deg','WindSpeed1','WindSpeed2','WindSpeed3','GeneratorTemperature_DegC','GearBoxTemperature_DegC']]
X10_test=X10_test.values

y10_test= df2_10['Power_kW']
y10_test=y10_test.values




# scaling values for model


x_scale = MinMaxScaler()
y_scale = MinMaxScaler()

X10_train= x_scale.fit_transform(X10_train)
y10_train= y_scale.fit_transform(y10_train.reshape(-1,1))
X10_test=  x_scale.fit_transform(X10_test)
y10_test=  y_scale.fit_transform(y10_test.reshape(-1,1))


X10_train = X10_train.reshape((-1,1,12)) 
X10_test = X10_test.reshape((-1,1,12))







# creating model using Keras
model10 = Sequential()
model10.add(GRU(units=512, return_sequences=True, input_shape=(1,12)))
model10.add(GRU(units=256, return_sequences=True))
model10.add(GRU(units=256))
model10.add(Dense(units=1, activation='sigmoid'))
model10.compile(loss=['mse'], optimizer='adam',metrics=['mse']) 
model10.summary() 

history10=model10.fit(X10_train, y10_train, batch_size=256, epochs=25,validation_split=0.20, verbose=1, callbacks=[TensorBoardColabCallback(tbc)])


score = model10.evaluate(X10_test, y10_test)
print('Score: {}'.format(score))



y10_predicted = model10.predict(X10_test)
y10_predicted = y_scale.inverse_transform(y10_predicted)

y10_test = y_scale.inverse_transform(y10_test)

plt.plot( y10_predicted, label='Predicted')
plt.plot( y10_test, label='Measurements')
plt.legend()
plt.savefig('/content/drive/My Drive/Figures/Power Prediction 10 Percent.png')
plt.show()

Answer 1

LSTMs（還有 GRUs，盡管它們的結構更輕）因容易過度擬合而臭名昭著。

減少每一層（32（層1）-64（層2））中的單元數（輸出大小）；您也可以完全消除最后一層。

其次，您正在使用激活“ sigmoid ”，但您的損失函數 + 指標是mse 。

確保您的問題是regression問題或classification問題。 如果確實是回歸，那么最后一步的激活函數應該是' linear '。 如果是分類，則應將 loss_function 更改為binary_crossentropy ，將度量更改為“ accuracy ”。

因此，顯示的情節暫時只是誤導。 如果您按照我的建議進行修改，並且仍然得到這樣的 train-val 損失圖，那么我們可以確定您有過度擬合的情況。

機器學習模型過擬合

問題描述

1 個解決方案

解決方案1
1 已采納 2020-03-07 07:59:33

機器學習模型過擬合

問題描述

1 個解決方案

解決方案1 1 已采納 2020-03-07 07:59:33

解決方案1
1 已采納 2020-03-07 07:59:33