张量流中的不同图像大小与batch_size = 1

Question

我想实现一个python类，它可以加载张量tensorflow model并实现推理。 但是我不知道如何输入具有可变图像尺寸的图像。 :(

class ArtGenerater():
    def __init__(self,model_path):
            self.model_path = model_path
            # vary shape?
            self.x = tf.placeholder(tf.float32,shape=(1,512,512,3))
            self.gen = model.resnet(self.x)
            self.out = tf.saturate_cast(self.gen,tf.uint8)

            self.sess = tf.Session()
            file = tf.train.lastest_checkpoint(self.model_path)
            saver = tf.train.Saver()
            saver.restore(self.sess,file)
    def pic(self,image_path):
            img =np.asarray(Image.open(image_path)).astype(np.float32)
            img = np.expand_dims(img,0)
            output_t = self.sess.run(self.out,feed_dict={self.x:img})
            return output_t

现在我只使用tf.placeholder(tf.float32,shape=(1,512,512,3)) ，但我的图像有不同的大小（例如1000 * 900）。

我该如何实现这个功能？ 谢谢。

编辑：

谢谢大家。我用以下方法解决了问题：

x = tf.placeholder(tf.string)
img = tf.image.decode_jpeg(x,channels=3)

这可以提供不同图像大小的网络（我的ConvNet包括许多conv2d和conv2d_tranpose ）。 :)

Answer 1

基本上，您可以使用None定义各种大小的输入，如下所示

self.x = tf.placeholder(tf.float32, [1, None, None, 3])

然后你可以提供不同的输入

feed_dict={self.x: current_data} etc..

但要小心你的神经网络结构。 如果您将最后一个转换图层压平为第一个密集图层的输入，那么您的网络仅适用于该大小，并且您需要拉伸或裁剪图像以使其正常工作。

更灵活的方法是使用全局平均池或空间金字塔池等方法来解决这个问题。

张量流中的不同图像大小与batch_size = 1

问题描述

1 个解决方案

解决方案1
4 2016-08-16 07:08:53

张量流中的不同图像大小与batch_size = 1

问题描述

1 个解决方案

解决方案1 4 2016-08-16 07:08:53

解决方案1
4 2016-08-16 07:08:53