繁体   English   中英

FailedPreconditionError: GetNext() 在加载 Tensorflow Saved_Model 后失败

[英]FailedPreconditionError: GetNext() failed after loading a Tensorflow Saved_Model

我构建了一个专门的类来构建、训练、保存然后加载我的模型。 节省是用做tf.saved_model.simple_save然后通过恢复tf.saved_model.loader.load

训练和推理是使用数据集 API 完成的。 使用经过训练的模型时一切正常。

但是,如果我恢复保存的模型,则推理会中断并引发此错误:

FailedPreconditionError(回溯见上文):GetNext() 失败,因为迭代器尚未初始化。 确保在获取下一个元素之前已为此迭代器运行了初始化操作。

[[节点:datasets/cond/IteratorGetNext_1 = IteratorGetNextoutput_shapes=[[?,?,30], [?,5]], output_types=[DT_INT32, DT_INT32], _device="/job:localhost/replica:0/task: 0/设备:CPU:0"]]

我确定迭代器已初始化( print按预期显示,请参阅下面的代码)。 它可能与属于的图形变量有关吗? 还有其他想法吗? 我有点卡在这里

(简化)代码

class Model():
    def __init__(self):
        self.graph = tf.Graph()
        self.sess = tf.Session(graph=self.graph)
        with self.graph.as_default():
            model.features_data_ph = tf.Placeholder(...)
            model.labels_data_ph = tf.Placeholder(...)

    def build(self):
        with self.graph.as_default():
            self.logits = my_model(self.input_tensor)
            self.loss = my_loss(self.logits, self.labels_tensor)

    def train(self):
        my_training_procedure()

    def set_datasets(self):
        with self.graph.as_default():
            with tf.variable_scope('datasets'):
                self.dataset = tf.data.Dataset.from_tensor_slices((self.features_data_ph, self.labels_data_ph))
                self.iter = self.dataset.make_initializable_iterator()
                self.input_tensor, self.labels_tensor = self.iter.get_next

    def initialize_iterators(self, inference_data):
        with self.graph.as_default():
            feats = inference_data
            labs = np.zeros((len(feats), self.hp.num_classes))
            self.sess.run(self.iter.initializer,
                feed_dict={self.features_data_ph: feats,
                    self.labels_data_ph: labs})
            print('Iterator ready to infer')

    def infer(self, inference_data):
        self.initialize_iterators(inference_data)
        return sess.run(self.logits)

    def save(self, path):
        inputs = {"features_data_ph": self.features_data_ph,
            "labels_data_ph": self.labels_data_ph}
        outputs = {"logits": self.model.logits}
        tf.saved_model.simple_save(self.sess, path)

    @staticmethod
    def restore(path):
        model = Model()
        tf.saved_model.loader.load(model.sess, [tag_constants.SERVING], path)
        model.features_data_ph = model.graph.get_tensor_by_name("features_data_ph:0")
        model.labels_data_ph = model.graph.get_tensor_by_name("labels_data_ph:0")
        model.logits = model.graph.get_tensor_by_name("model/classifier/dense/BiasAdd:0")
        model.set_datasets()
        return model

失败例程

model1 = Model()
model1.build()
model1.train()
model1.save(model1_path)

...

model2 = Model.restore(model1_path)
model2.infer(some_numpy_array) # Error here, after print, at sess.run()

(恢复模型工作,原始模型和恢复模型之间的张量值匹配)

我遇到了同样的问题,我认为问题在于您正在初始化一个新的 Dataset 对象,而不是初始化与模型一起保存的 Iterator。

尝试:

make_iter = model.get_operation_by_name("YOURPREFIX/MakeIterator")
sess.run(make_iter, feed_dict)
model.infer(some_numpy_array)

我通过改变创建Dataset的方式解决了这个问题

iterator = tf.data.Iterator.from_structure(dataset.output_types, dataset.output_shapes)
dataset_init_op = iterator.make_initializer(dataset, name='dataset_init')
...
#retstoring
dataset_init_op = restored_graph.get_operation_by_name('dataset_init')
sess.run(
    dataset_init_op,
    feed_dict={...}
)

那里有一段工作代码 -> https://vict0rsch.github.io/2018/05/17/restore-tf-model-dataset/

一种简单的方法:在循环之前,添加一行代码:

tf.add_to_collection("saved_model_main_op",tf.group([train_iter], name='legacy_init_op'))

“saved_model_main_op”是固定的。

train_iter 是初始化迭代器的选项

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM