使用 tensorflow 进行增量模型训练

Question

我有一个简单的线性模型，它输入 (x, y) 对并在 y = b0 + b1 * x 中推导出 b0 和 b1 ； 关键代码如下。 它在已知大小的数据集上进行训练。 现在我想增加不断训练它的能力：即每隔一批（x，y）相加，并根据新数据更新系数。 将有无限量的输入。

    x = tf.placeholder(tf.float32, [data_len], name="x")
    y = ...
    b0 = tf.Variable([0.8], trainable=True)
    b1 = ...
    #the model
    y = tf.add(tf.mul(x, b1), b0)
    y_act = tf.placeholder(tf.float32, [data_len], name="y_act")
    error = tf.sqrt((y - y_act) * (y - y_act))
    train_step = tf.train.AdamOptimizer(0.01).minimize(error)
    x_in = ...
    y_in = ...
    init = tf.initialize_all_variables()
    sess.run(init)
    feed_dict = { ... }
    fetches_in = { b0: b0, b1: b1, y: y, train_step: train_step }
    for i in range(0, 50):
        fetches = sess.run(fetches_in, feed_dict)

我的想法是记住迄今为止训练过的系数，用它们初始化一个模型，然后用新的数据部分再次重复训练。 在每个输入上重复。 这是正确的方法吗？ 该模型可能会在以后升级为更复杂的模型。

Answer 1

听起来您在谈论在线训练，即在使用传入数据的同时不断训练模型。 您是对的，您应该能够从上次中断的地方继续前进并输入新数据。 您需要的是一种在培训课程之间保存和加载变量的方法。 您可以使用 tf.Saver 在“原始”张量流中执行此操作。

您也可以使用 tf.contrib.learn.Estimator 为您执行此操作。 您只需给它一个用于构建模型的 model_fn 和一个用于保存模型的 model_dir，它就会处理其余的工作。 当然，tf.contrib.learn.LinearEstimator 中已经有一个线性模型。 使用估算器，只要有新数据，您只需调用 fit(...) ，它就会加载您的变量并继续运行您定义的训练步骤。

使用 tensorflow 进行增量模型训练

问题描述

1 个解决方案

解决方案1
5 已采纳 2017-06-20 13:19:10

使用 tensorflow 进行增量模型训练

问题描述

1 个解决方案

解决方案1 5 已采纳 2017-06-20 13:19:10

解决方案1
5 已采纳 2017-06-20 13:19:10