Tensorflow GPU /多GPU如何分配内存？

Question

我有两个问题：

（1）Tensorflow在仅使用一个GPU时如何分配GPU内存？ 我有一个像这样的卷积2d的实现（全局使用GPU）：

def _conv(self, name, x, filter_size, in_filters, out_filters, strides):
    with tf.variable_scope(name):
        n = filter_size * filter_size * out_filters
        kernel = tf.get_variable(
            '', [filter_size, filter_size, in_filters, out_filters], tf.float32,
            initializer=tf.random_normal_initializer(stddev=np.sqrt(2.0 / n)),
        )
        return tf.nn.conv2d(x, kernel, strides, padding='SAME')
        # another option
        # x = tf.nn.conv2d(x, kernel, strides, padding='SAME')
        # return x

注释中的另一个选项执行相同的操作但添加了一个新变量x 。 在这种情况下，TF会分配更多GPU内存吗？

（2）使用多个GPU时。 我想使用list来收集来自多个GPU的结果。 实施如下：

def _conv(self, name, input, filter_size, in_filters, out_filters, strides, trainable=True):
    assert type(input) is list
    assert len(input) == FLAGS.gpu_num

    n = filter_size * filter_size * out_filters
    output = []
    for i in range(len(input)):
        with tf.device('/gpu:%d' % i):
            with tf.variable_scope(name, reuse=i > 0):
                kernel = tf.get_variable(
                    '', [filter_size, filter_size, in_filters, out_filters], tf.float32,
                    initializer=tf.random_normal_initializer(stddev=np.sqrt(2.0 / n))
                )
                output.append(tf.nn.conv2d(input[i], kernel, strides, padding='SAME'))

    return output

由于list的使用，TF会分配更多内存吗？ output （ list ）是否附加到某些GPU设备？ 我有这些问题，因为当我使用两个GPU来训练CNN时，该程序使用的GPU内存比使用一个GPU时要多得多。 我认为有些事我错过了或被误解了。

Answer 1

使用此代码检查每个张量和连接的设备。

for n in tf.get_default_graph().as_graph_def().node:
    print n.name, n.device

那么这两个问题的答案是：

（1）不。

（2）如果我想在GPU上收集直接数据，并且数据被认为是计算梯度，那么就会出现问题。 因为计算梯度也会消耗内存。 通过GPU访问数据时，将分配额外的内存。

Tensorflow GPU /多GPU如何分配内存？

问题描述

1 个解决方案

解决方案1
0 已采纳 2017-06-14 22:50:10

Tensorflow GPU /多GPU如何分配内存？

问题描述

1 个解决方案

解决方案1 0 已采纳 2017-06-14 22:50:10

解决方案1
0 已采纳 2017-06-14 22:50:10