[英]Tensorflow make assign op an explicit dependency for computing a tensor
我希望每次运行另一个张量取决于tf.Variable
时都隐式地运行assign
Op,这在assign
Op期间会更改。 我不想手动运行assign
操作。 我尝试了2种不同的方法。 这是一个简单的示例插图:
target_prob = tf.placeholder(dtype=tf.float32, shape=[None, 2])
target_var = tf.Variable(0, trainable=False, dtype=tf.float32)
init_target_var = tf.assign(target_var, tf.zeros_like(target_prob),
validate_shape=False)
# First approach
with tf.control_dependencies([init_target_var]):
result = target_prob + target_var
# Second approach
# [target_var] = tf.tuple([target_var], control_inputs=[init_target_var])
# result = target_prob + target_var
sess = tf.Session()
sess.run(tf.global_variables_initializer())
res1 = sess.run(result, feed_dict={target_prob: np.ones([10, 2], dtype=np.float32)})
res2 = sess.run(result, feed_dict={target_prob: np.ones([12, 2], dtype=np.float32)})
两者都失败,并显示错误InvalidArgumentError (see above for traceback): Incompatible shapes: [12,2] vs. [10,2]
计算res2
时, InvalidArgumentError (see above for traceback): Incompatible shapes: [12,2] vs. [10,2]
。 如果我改为这样做,这一切都可行:
res1 = sess.run(result, feed_dict={target_prob: np.ones([10, 2], dtype=np.float32)})
sess.run(init_target_var, feed_dict={target_prob: np.ones([12, 2], dtype=np.float32)})
res2 = sess.run(result, feed_dict={target_prob: np.ones([12, 2], dtype=np.float32)})
但是,再次明确地运行init_target_var
正是我要避免的事情。
PS以上只是一个简单的例子。 我的最终目标是使用来自tf.scatter_add的结果张量,不幸的是,该张量需要可变的张量作为输入。
对于遇到这种情况的任何人,在计算result
时我实际上使用了错误的张量。 正确的代码是:
import tensorflow as tf
import numpy as np
target_prob = tf.placeholder(dtype=tf.float32, shape=[None, 2])
tmp_var = tf.Variable(0, trainable=False, dtype=tf.float32, validate_shape=False)
target_var = tf.assign(tmp_var, tf.zeros_like(target_prob), validate_shape=False)
with tf.control_dependencies([target_var]):
result = target_prob + target_var
sess = tf.Session()
sess.run(tf.global_variables_initializer())
res1 = sess.run(result, feed_dict={target_prob: np.ones([10, 2], dtype=np.float32)})
res2 = sess.run(result, feed_dict={target_prob: np.ones([12, 2], dtype=np.float32)})
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.