TensorFlow的checkpoint文件大小與參數個數的關系

Question

我想知道TensorFlow檢查點文件的大小與模型參數數量之間的關系。

我有一個包含1.8萬個參數的模型，它應該需要大約7 MB 的內存（假設(4 * 1.8 * 10^6) / 1024^2 ）。 但是，保存的檢查點顯然更大

model-5000.data-00000-of-00001   15MB
model-5000.index  15K

在 Caffe 中，4 的分數對於caffemodel似乎總是正確的。

Answer 1

您是否使用了具有動量的優化器？ 這將使保存的參數數量增加一倍（每個參數都有一個相應的動量參數）。 如果您使用 Adam，由於平方梯度估計器，保存的參數數量實際上將增加三倍。 其他優化器會以不同的方式變化。

您可以手動檢查檢查點以查看正在存儲哪些變量。

Answer 2

我會說檢查點文件不是100％可比.caffemodel文件。 除了模型參數外，它將包含更多內容，例如，加載數據節點，權重初始化程序，保護程序節點等。參數也將另存為可訓練的變量，這會占用更多空間。

為了獲得與caffe的.caffemodel類似的東西，您需要將變量轉換為常量（稱為凍結圖），然后將圖另存為二進制原型文件（.pb）。 這樣做將刪除圖中所有不必要的節點。

要轉換為.pb，您可以按照以下步驟進行調整：

 output_graph_def = tf.graph_util.convert_variables_to_constants(
        sess,                       # The session is used to retrieve the weights
        sess.graph_def,             # The graph_def is used to retrieve the nodes 
        output_node_names           # The output node name
    ) 

    # Finally we serialize and dump the output graph to the filesystem
    with open('mode.pb', 'wb') as f:
        f.write(output_graph_def.SerializeToString())

TensorFlow的checkpoint文件大小與參數個數的關系

問題描述

2 個解決方案

解決方案1
0 2021-12-02 00:11:40

解決方案2
-1 2018-03-16 13:43:31

TensorFlow的checkpoint文件大小與參數個數的關系

問題描述

2 個解決方案

解決方案1 0 2021-12-02 00:11:40

解決方案2 -1 2018-03-16 13:43:31

解決方案1
0 2021-12-02 00:11:40

解決方案2
-1 2018-03-16 13:43:31