在 Python 中使用 Keras 和 TensorFlow 無法重現結果

Question

我有一個問題，我無法使用 Keras 和 ThensorFlow 重現我的結果。

似乎最近在Keras 文檔站點上發布了針對此問題的解決方法，但不知何故它對我不起作用。

我做錯了什么？

我在 MBP Retina（沒有 Nvidia GPU）上使用 Jupyter Notebook。

# ** Workaround from Keras Documentation **

import numpy as np
import tensorflow as tf
import random as rn

# The below is necessary in Python 3.2.3 onwards to
# have reproducible behavior for certain hash-based operations.
# See these references for further details:
# https://docs.python.org/3.4/using/cmdline.html#envvar-PYTHONHASHSEED
# https://github.com/fchollet/keras/issues/2280#issuecomment-306959926

import os
os.environ['PYTHONHASHSEED'] = '0'

# The below is necessary for starting Numpy generated random numbers
# in a well-defined initial state.

np.random.seed(42)

# The below is necessary for starting core Python generated random numbers
# in a well-defined state.

rn.seed(12345)

# Force TensorFlow to use single thread.
# Multiple threads are a potential source of
# non-reproducible results.
# For further details, see: https://stackoverflow.com/questions/42022950/which-seeds-have-to-be-set-where-to-realize-100-reproducibility-of-training-res

session_conf = tf.ConfigProto(intra_op_parallelism_threads=1, inter_op_parallelism_threads=1)

from keras import backend as K

# The below tf.set_random_seed() will make random number generation
# in the TensorFlow backend have a well-defined initial state.
# For further details, see: https://www.tensorflow.org/api_docs/python/tf/set_random_seed

tf.set_random_seed(1234)

sess = tf.Session(graph=tf.get_default_graph(), config=session_conf)
K.set_session(sess)


# ** Workaround end **

# ** Start of my code **


# LSTM and CNN for sequence classification in the IMDB dataset
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
from keras.layers.embeddings import Embedding
from keras.preprocessing import sequence
from sklearn import metrics
# fix random seed for reproducibility
#np.random.seed(7)

# ... importing data and so on ...

# create the model
embedding_vecor_length = 32
neurons = 91
epochs = 1
model = Sequential()
model.add(Embedding(top_words, embedding_vecor_length, input_length=max_review_length))
model.add(LSTM(neurons))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss='mean_squared_logarithmic_error', optimizer='adam', metrics=['accuracy'])
print(model.summary())
model.fit(X_train, y_train, epochs=epochs, batch_size=64)
# Final evaluation of the model
scores = model.evaluate(X_test, y_test, verbose=0)
print("Accuracy: %.2f%%" % (scores[1]*100))

使用的 Python 版本：

Python 3.6.3 |Anaconda custom (x86_64)| (default, Oct  6 2017, 12:04:38) 
[GCC 4.2.1 Compatible Clang 4.0.1 (tags/RELEASE_401/final)]

解決方法已包含在代碼中（無效）。

每次我做訓練部分時，我都會得到不同的結果。

重置Jupyter Notebook內核時，第一次對應第一次，第二次對應第二次。

所以在重置后，我總是會在第一次運行時得到0.7732 ，在第二次運行時得到0.7782 ，等等。

但是每次運行沒有內核重置的結果總是不同的。

我會對任何建議有所幫助！

Answer 1

我遇到了完全相同的問題，並設法通過每次運行模型時關閉並重新啟動 tensorflow 會話來解決它。 在您的情況下，它應該如下所示：

#START A NEW TF SESSION
np.random.seed(0)
tf.set_random_seed(0)
sess = tf.Session(graph=tf.get_default_graph())
K.set_session(sess)

embedding_vecor_length = 32
neurons = 91
epochs = 1
model = Sequential()
model.add(Embedding(top_words, embedding_vecor_length, input_length=max_review_length))
model.add(LSTM(neurons))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss='mean_squared_logarithmic_error', optimizer='adam', metrics=['accuracy'])
print(model.summary())
model.fit(X_train, y_train, epochs=epochs, batch_size=64)
# Final evaluation of the model
scores = model.evaluate(X_test, y_test, verbose=0)
print("Accuracy: %.2f%%" % (scores[1]*100))

#CLOSE TF SESSION
K.clear_session()

我運行了以下代碼並使用 GPU 和 tensorflow 后端獲得了可重現的結果：

print datetime.now()
for i in range(10):
    np.random.seed(0)
    tf.set_random_seed(0)
    sess = tf.Session(graph=tf.get_default_graph())
    K.set_session(sess)

    n_classes = 3
    n_epochs = 20
    batch_size = 128

    task = Input(shape = x.shape[1:])
    h = Dense(100, activation='relu', name='shared')(task)
    h1= Dense(100, activation='relu', name='single1')(h)
    output1 = Dense(n_classes, activation='softmax')(h1)

    model = Model(task, output1)
    model.compile(loss='categorical_crossentropy', optimizer='Adam')
    model.fit(x_train, y_train_onehot, batch_size = batch_size, epochs=n_epochs, verbose=0)
print(model.evaluate(x=x_test, y=y_test_onehot, batch_size=batch_size, verbose=0))
K.clear_session()

並獲得了這個輸出：

2017-10-23 11:27:14.494482
0.489712882132
0.489712893813
0.489712892765
0.489712854426
0.489712882132
0.489712864011
0.486303713004
0.489712903398
0.489712892765
0.489712903398

我的理解是，如果您不關閉 tf 會話（您是通過在新內核中運行來完成的），您將繼續對相同的“種子”分布進行采樣。

Answer 2

看起來像是 TensorFlow / Keras 中的一個錯誤，不確定。 將 Keras 后端設置為 CNTK 時，結果是可重現的。

我什至嘗試過從 1.2.1 到 1.13.1 的幾個版本的 TensorFlow。 即使設置了隨機種子，所有 TensorFlow 版本的結果也與多次運行不一致。

Answer 3

我的答案如下，它使用 Keras 和 Tensorflow 作為后端。 在嵌套的 for 循環中，通常會遍歷您希望為模型開發探索的各種參數，在最后一個for loop之后立即添加此函數。

for...
   for...
      reset_keras()
      .
      .
      .

其中重置函數定義為

def reset_keras():
    sess = tf.keras.backend.get_session()
    tf.keras.backend.clear_session()
    sess.close()
    sess = tf.keras.backend.get_session()
    np.random.seed(1)
    tf.set_random_seed(2)

PS：上面的函數實際上也避免了你的 nvidia GPU 建立過多的內存（在多次迭代后發生），因此它最終變得非常慢......所以該函數恢復了 GPU 性能並保持結果可重現。

Answer 4

對我有用的是每次都在新控制台中運行培訓。 除此之外，我還設置了以下參數：

RANDOM_STATE = 42

os.environ['PYTHONHASHSEED'] = str(RANDOM_STATE)
random.seed(RANDOM_STATE)
np.random.seed(RANDOM_STATE)
tf.set_random_seed(RANDOM_STATE)

session_conf = tf.ConfigProto(intra_op_parallelism_threads=1, inter_op_parallelism_threads=1)
sess = tf.Session(graph=tf.get_default_graph(), config=session_conf)
K.set_session(sess)

intra_op_parallelism也可以是更大的值

在 Python 中使用 Keras 和 TensorFlow 無法重現結果

問題描述

4 個解決方案

解決方案1
6 2017-10-23 09:45:42

解決方案2
0 2019-04-03 14:28:15

解決方案3
0 2019-05-11 10:16:12

解決方案4
0 2020-03-26 10:51:45

在 Python 中使用 Keras 和 TensorFlow 無法重現結果

問題描述

4 個解決方案

解決方案1 6 2017-10-23 09:45:42

解決方案2 0 2019-04-03 14:28:15

解決方案3 0 2019-05-11 10:16:12

解決方案4 0 2020-03-26 10:51:45

解決方案1
6 2017-10-23 09:45:42

解決方案2
0 2019-04-03 14:28:15

解決方案3
0 2019-05-11 10:16:12

解決方案4
0 2020-03-26 10:51:45