np.mean 和 tf.reduce_mean 有什么區別？

Question

accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))

tf.cast基本上改變了對象的張量類型，但是tf.reduce_mean和np.mean之間有什么區別？

這是tf.reduce_mean上的文檔：

reduce_mean(input_tensor, reduction_indices=None, keep_dims=False, name=None)

input_tensor ：要減少的張量。 應該有數字類型。

reduction_indices ：要減少的維度。 如果None （默認值），則減少所有維度。
 # 'x' is [[1., 1. ]] # [2., 2.]] tf.reduce_mean(x) ==> 1.5 tf.reduce_mean(x, 0) ==> [1.5, 1.5] tf.reduce_mean(x, 1) ==> [1., 2.]

對於一維向量，它看起來像np.mean == tf.reduce_mean ，但我不明白tf.reduce_mean(x, 1) ==> [1., 2.]發生了什么。 tf.reduce_mean(x, 0) ==> [1.5, 1.5]有點意思，因為[1, 2]和[1, 2]平均值是[1.5, 1.5] ，但是tf.reduce_mean(x, 1)發生了tf.reduce_mean(x, 1) ?

Answer 1

numpy.mean和tensorflow.reduce_mean的功能是相同的。 他們做同樣的事情。 從文檔中，對於numpy和tensorflow ，您可以看到這一點。 讓我們看一個例子，

c = np.array([[3.,4], [5.,6], [6.,7]])
print(np.mean(c,1))

Mean = tf.reduce_mean(c,1)
with tf.Session() as sess:
    result = sess.run(Mean)
    print(result)

輸出

[ 3.5  5.5  6.5]
[ 3.5  5.5  6.5]

在這里你可以看到當axis （numpy）或reduction_indices （tensorflow）為1時，它計算（3,4）和（5,6）和（6,7）的平均值，所以1定義了計算平均值的軸. 當它為 0 時，在 (3,5,6) 和 (4,6,7) 之間計算平均值，依此類推。 我希望你能明白。

現在它們之間有什么區別？

您可以在 python 上的任何位置計算 numpy 操作。 但是為了進行 tensorflow 操作，必須在 tensorflow Session內完成。 您可以在此處閱讀更多相關信息。 因此，當您需要對 tensorflow 圖（或結構，如果您願意）執行任何計算時，它必須在 tensorflow Session內完成。

讓我們再看一個例子。

npMean = np.mean(c)
print(npMean+1)

tfMean = tf.reduce_mean(c)
Add = tfMean + 1
with tf.Session() as sess:
    result = sess.run(Add)
    print(result)

我們可以自然地在numpy中將 mean 增加1 ，但是為了在 tensorflow 中執行此操作，您需要在Session執行該操作，而不使用Session則無法執行此操作。 換句話說，當您計算tfMean = tf.reduce_mean(c) ，tensorflow 不會計算它。 它只在Session計算。 但是 numpy 會在您編寫np.mean()時立即計算。

我希望這是有道理的。

Answer 2

這里的關鍵是reduce這個詞，它是函數式編程的一個概念，它使得TensorFlow中的reduce_mean可以保持一批輸入計算結果的運行平均值。

如果您不熟悉函數式編程，這可能看起來很神秘。 所以首先讓我們看看reduce是做什么的。 如果你得到一個像 [1,2,5,4] 這樣的列表，並被告知計算平均值，那很容易——只需將整個數組傳遞給np.mean可以得到平均值。 但是，如果您必須計算數字流的平均值怎么辦？ 在這種情況下，您必須首先通過從流中讀取來組裝數組，然后對結果數組調用np.mean - 您將不得不編寫更多代碼。

另一種方法是使用reduce 范式。 舉個例子，看看我們如何在 python 中使用 reduce 來計算數字的總和： reduce(lambda x,y: x+y, [1,2,5,4]) 。

它是這樣工作的：

第 1 步：從列表中讀取 2 位數字 - 1,2。 評估 lambda 1,2。 reduce 存儲結果 3. 注意 - 這是從列表中讀取 2 位數字的唯一步驟
第 2 步：從列表中讀取下一個數字 - 5. 評估 lambda 5、3（3 是第 1 步的結果，reduce 存儲）。 reduce 存儲結果 8.
第 3 步：從列表中讀取下一個數字 - 4. 評估 lambda 8,4（8 是第 2 步的結果，即減少存儲）。 reduce 存儲結果 12
第 4 步：從列表中讀取下一個數字 - 沒有，因此返回 12 的存儲結果。

在此處閱讀更多Python 函數式編程

要了解這如何應用於 TensorFlow，請查看以下代碼塊，該代碼塊定義了一個簡單的圖形，它接收一個浮點數並計算平均值。 然而，圖形的輸入不是單個浮點數，而是浮點數數組。 reduce_mean計算所有這些浮點數的平均值。

import tensorflow as tf


inp = tf.placeholder(tf.float32)
mean = tf.reduce_mean(inp)

x = [1,2,3,4,5]

with tf.Session() as sess:
    print(mean.eval(feed_dict={inp : x}))

當計算批量圖像的值時，這種模式會派上用場。 看看Deep MNIST 示例，你會看到如下代碼：

correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

Answer 3

新文檔指出tf.reduce_mean()產生與 np.mean 相同的結果：

相當於 np.mean

它還具有與np.mean完全相同的參數。 但這里有一個重要的區別：它們僅在浮點值上產生相同的結果：

import tensorflow as tf
import numpy as np
from random import randint

num_dims = 10
rand_dim = randint(0, num_dims - 1)
c = np.random.randint(50, size=tuple([5] * num_dims)).astype(float)

with tf.Session() as sess:
    r1 = sess.run(tf.reduce_mean(c, rand_dim))
    r2 = np.mean(c, rand_dim)
    is_equal = np.array_equal(r1, r2)
    print is_equal
    if not is_equal:
        print r1
        print r2

如果去掉類型轉換，會看到不同的結果

除此之外，許多其他tf.reduce_函數如reduce_all 、 reduce_any 、 reduce_min 、 reduce_max 、 reduce_prod產生與 numpy 類似物相同的值。 顯然，因為它們是操作，所以它們只能從會話內部執行。

Answer 4

1通常指行，而2通常指列。 減少“超過”索引1意味着減少 rowwise。

[1., 2.]就是[ <row 1 mean> , <row 2 mean> ] 。

這種索引編號約定在統計軟件中很典型，尤其是 R。

np.mean 和 tf.reduce_mean 有什么區別？

問題描述

4 個解決方案

解決方案1
121 已采納 2015-12-12 06:55:01

解決方案2
26 2017-11-11 19:58:05

解決方案3
5 2017-05-01 01:19:23

解決方案4
-1 2015-12-12 00:49:39

np.mean 和 tf.reduce_mean 有什么區別？

問題描述

4 個解決方案

解決方案1 121 已采納 2015-12-12 06:55:01

解決方案2 26 2017-11-11 19:58:05

解決方案3 5 2017-05-01 01:19:23

解決方案4 -1 2015-12-12 00:49:39

解決方案1
121 已采納 2015-12-12 06:55:01

解決方案2
26 2017-11-11 19:58:05

解決方案3
5 2017-05-01 01:19:23

解決方案4
-1 2015-12-12 00:49:39